神經網絡的激活函數必須使用非線性函數

激活函數不能使用線性函數。爲什麼不能使用線性函數呢?因爲使用線性函數的話,加深神經網絡的層數就沒有意義了

線性函數的問題在於,不管如何加深層數,總是存在與之等效的“無
隱藏層的神經網絡”。爲了具體地(稍微直觀地)理解這一點,我們來思
考下面這個簡單的例子。這裏我們考慮把線性函數 h(x) = cx 作爲激活
函數,把y(x) = h(h(h(x)))的運算對應3層神經網絡 A。這個運算會進行
y(x) = c × c × c × x的乘法運算,但是同樣的處理可以由y(x) = ax方
(注意,a = c三次方)這一次乘法運算(即沒有隱藏層的神經網絡)來表示。

使用線性函數時,無法發揮多層網絡帶來的優勢。因此,爲了發揮疊加層所帶來的優勢,激活函數必須使用非線性函數。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章