從 lenet5 學習 cnn

卷積神經網絡中有四個主要操作:
1.卷積
2.非線性變換(ReLU)
3.池化或子採樣
4.分類(完全連接層)

卷積的主要目的是從輸入圖像中提取特徵。通過使用輸入數據中的小方塊來學習圖像特徵,卷積保留了像素間的空間關係。
過濾器就是原始輸入圖像的特徵檢測器。
在這裏插入圖片描述
池化的作用是逐步減少輸入的空間大小[4]。具體來說有以下四點:

使輸入(特徵維度)更小,更易於管理
減少網絡中的參數和運算次數,因此可以控制過擬合 [4]
使網絡對輸入圖像微小的變換、失真和平移更加穩健(輸入圖片小幅度的失真不會改池化的輸出結果 —— 因爲我們取了鄰域的最大值/平均值)。
可以得到尺度幾乎不變的圖像(確切的術語是“等變”)。這是非常有用的,這樣無論圖片中的物體位於何處,我們都可以檢測到,(詳情參閱[18]和[19])

https://www.plob.org/article/16273.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章