深度學習 神經網絡 邏輯斯蒂迴歸模型

神經元

在這裏插入圖片描述
hW,b(x)=f(WTx)=f(i=13wixi+b)h_{W, b}(x) = f(W^Tx) = f(\sum^{3}_{i=1}w_ix_i+b)

  • WW 表示權重, 是一個向量
  • ww 表示 WW中的元素
  • xx 表示特徵
  • f()f() 表示激活函數
  • bb 是偏置, (如果沒有bb, 那麼分類線或者分類面都必須經過原點), bb 可以看作 WW 中的 w0w_0, 與圖中的 +1 相乘

二分類

把激活函數應用到神經元上, 就可以得到一個二分類邏輯斯蒂迴歸模型

如果激活函數是 sigmoid, 即f(x)=11+exf(x) = \frac{1}{1+e^{-x}}, 則
hW(x)=f(WTx)=11+eWTx h_{W}(x) = f(W^Tx) = \frac {1} {1+e^{-W^Tx}}
P(Y=0x)=hW(x)=11+eWTxP(Y=1x)=1hW(x)=eWTx1+eWTx P(Y=0|x) = h_{W}(x) = \frac {1} {1+e^{-W^Tx}} \\ P(Y=1|x) = 1 - h_{W}(x) = \frac {e^{-W^Tx}} {1+e^{-W^Tx}} \\
這兩個式子可以看做是 11eWTxe^{-W^Tx} 做歸一化,
那麼多分類就是 11, eW1Txe^{-W^T_1x}, eW2Txe^{-W^T_2x}eWkTxe^{-W^T_kx} 做歸一化

多分類

在這裏插入圖片描述
再加一個神經元, 就可以做三分類(兩個神經元各一類, 1減去兩類爲第三類)
也就是把 WW 從向量擴展爲矩陣, WnW_n表示矩陣中的第nn個向量,
輸出 WxW*x 則變爲向量

如果分爲 KK

P(Y=kx)=eWkTx1+1k1eWkTxk=1,2,...K1P(Y=kx)=11+1k1eWkTxk=K P(Y=k|x) = \frac{e^{-W^T_kx}}{1+\sum^{k-1}_{1}e^{-W^T_k x}} \quad k=1,2,...K-1\\ P(Y=k|x) = \frac{1}{1+\sum^{k-1}_{1}e^{-W^T_k x}} \quad k=K

舉例:
X=[3,1,2]X = [3, 1, 2]
W=[[0.4,0.6,0.5],[0.3,0.2,0.1]]W = [[0.4, 0.6, 0.5], [0.3, 0.2, 0.1]]
WXW*XY=[y0,y1]=[2.8,1.3]Y = [y_0, y_1] = [2.8,1.3]
eY=[e2.8,e1.3]=[0.006,0.27]e^{-Y} = [e^{-2.8}, e^{-1.3}] =[0.006, 0.27]
Sum=1+0.06+0.27=1.33Sum = 1+ 0.06+0.27 = 1.33

P(Y=0x)=0.06/1.33=0.045P(Y=0|x) =0.06/1.33 = 0.045
P(Y=1x)=0.27/1.33=0.203P(Y=1|x) =0.27/1.33 = 0.203
P(Y=2x)=1.00/1.33=0.752P(Y=2|x) =1.00/1.33 = 0.752

目標函數

平方差損失

1nx,y12(yModel(x))2 \frac{1}{n}\sum _{x,y}\frac{1}{2}(y-Model(x))^2

  • 12\frac{1}{2} 是爲了求導方便
  • yy 需要做 one hot 編碼

交叉熵損失

1nx,yyln(Model(x)) \frac{1}{n}\sum_{x, y} yln(Model(x))

梯度下降

xt+1=xtαf(xt) x_{t+1} = x_t - \alpha \triangledown f(x_t)

  • f(x)\triangledown f(x)xx 求偏導
  • α\alpha 學習率

動量梯度下降

vt+1=ρvt+f(xt)xt+1=xtαvt+1 v_{t+1} = \rho v_t + \triangledown f(x_t)\\ x_{t+1} = x_t - \alpha v_{t+1}

  • vtv_t 爲之前梯度的積累值
  • vt+1v_{t+1} 爲之前梯度的積累值加上當前梯度的新的積累值
  • 由於梯度是矢量, 所以他們的加法包括大小和方向
    在這裏插入圖片描述
  • 訓練開始時, 動量積累得快, 可以加速訓練
  • 在局部極值附加震盪時, 可以藉助動量跳出來
  • 如果梯度方向發生變化, 動量能夠緩解震盪
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章