Tensorflow2.1基礎知識---神經網絡參數優化器

原創

2020-06-13 02:38

什麼是優化器？
優化器，就是神經網絡進行反向傳播的時候，用於更新參數的策略，也就是梯度下降的算法。
優化器更新參數的步驟（4步）：
a. 計算t時刻損失函數關於當前參數的梯度：g_t= ∆loss= ∂loss/(∂(w_t))
b. 計算t時刻一階動量m_t 和二階動量V_t （一階動量：與梯度相關的函數二階動量：與梯度平方相關的函數）
c. 計算t時刻下降梯度：μ_t=lr∗ m_t⁄√(V_t )
d. 計算t+1時刻參數：w_(t+1)= w_t− μ_t= w_t−lr∗ m_t⁄√(V_t )
優化器的種類（不同優化器就是一階動量和二階動量的定義不同）：
a. SGD（Stochastic Gradient Descent）(無momentum)最常用的梯度下降算法

b. SGDM(含momentum的SGD)，在SGD基礎上增加一階動量

c. Adagrad，在SGD的基礎上增加二階動量

d. RMSProp，在SGD的基礎上增加二階動量

e. Adam，結合了SGDM一階動量和RMSProp二階動量
不同優化器的對比比較（比較的結果是對鳶尾花分類基礎上分類利用不同的優化器得到的結果）

下面的是筆者的微信公衆號，歡迎關注，會持續更新c++、python、tensorflow、機器學習、深度學習等系列文章

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Tensorflow2.1基礎知識---豐富神經網絡八股的內容

本篇文章的主要目的是對上一篇文章已經搭建好的網絡進一步豐富其內容，具體體現在6個方面： 1. 加載自己製作的訓練集 2. 數據增強 3. 斷點續訓 4. 參數提取 5. acc/loss可視化 6. 給圖識物加

2020-06-13 02:38:40

Tensorflow2.1基礎知識---張量

張量（Tensor）：多維數組（列表）階：張量的維數張量可以表示0階到n階數組（列表）基本的數據類型 tf.int，tf.float tf.bool tf.string 生成一個張量如何創建一個張量用法：tf.c

2020-06-13 02:38:40

Tensorflow2.1基礎知識---搭建神經網絡八股以及小案例實戰

本片文章的目的是:利用Tensorflow API tf.keras搭建網絡八股(六步法) 六步法：導入相關的模塊，也就是 import 加載訓練集和測試集，也就是加載train（x_train數據、y_train標籤）、t

2020-06-13 02:38:40

Tensorflow2.1基礎知識---複雜度、學習率、激活函數、損失函數

文章目錄複雜度學習率激活函數損失函數複雜度空間複雜度（用層數和待優化的參數個數表示）層數 = 隱藏層的層數+1個輸出層(輸入層不算) 總參數 = 總w + 總b 時間複雜度：乘加運算次數學習率學習率是一個超參

2020-06-13 02:38:40

tensorflow2.1案例實戰---神經網絡實現鳶尾花分類

2020-03-20 15:55:00

Tensorflow2.1基礎知識---緩解過擬合

2020-03-20 15:55:00

Tensorflow2.1基礎知識---常用的函數API

2020-03-19 01:27:08

Tensorflow2.1基礎知識---豐富神經網絡八股的內容

本篇文章的主要目的是對上一篇文章已經搭建好的網絡進一步豐富其內容，具體體現在6個方面： 1. 加載自己製作的訓練集 2. 數據增強 3. 斷點續訓 4. 參數提取 5. acc/loss可視化 6. 給圖識物加

2020-06-13 02:38:40

Tensorflow2.1基礎知識---張量

張量（Tensor）：多維數組（列表）階：張量的維數張量可以表示0階到n階數組（列表）基本的數據類型 tf.int，tf.float tf.bool tf.string 生成一個張量如何創建一個張量用法：tf.c

2020-06-13 02:38:40

Tensorflow2.1基礎知識---搭建神經網絡八股以及小案例實戰

本片文章的目的是:利用Tensorflow API tf.keras搭建網絡八股(六步法) 六步法：導入相關的模塊，也就是 import 加載訓練集和測試集，也就是加載train（x_train數據、y_train標籤）、t

2020-06-13 02:38:40

Tensorflow2.1基礎知識---複雜度、學習率、激活函數、損失函數

文章目錄複雜度學習率激活函數損失函數複雜度空間複雜度（用層數和待優化的參數個數表示）層數 = 隱藏層的層數+1個輸出層(輸入層不算) 總參數 = 總w + 總b 時間複雜度：乘加運算次數學習率學習率是一個超參

2020-06-13 02:38:40

tensorflow2.1案例實戰---神經網絡實現鳶尾花分類

2020-03-20 15:55:00

Tensorflow2.1基礎知識---緩解過擬合

2020-03-20 15:55:00

Tensorflow2.1基礎知識---常用的函數API

2020-03-19 01:27:08

24小時熱門文章

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

最新文章

最新評論文章