卷積與池化層區別&YOLOV3三問三答

卷積神經網絡由卷積核來提取特徵，通過池化層對顯著特徵進行提取，經過多次的堆疊，得到比較高級的特徵，最後可以用分類器來分類。

CNN整個的計算過程，最重要的有兩點：組合性和局部不變性（平移、旋轉、尺度放縮）。

組合性：

每個卷積核可以看做某種特徵的提取器。所謂組合性就是將卷積核提取的一些簡單特徵進行組合，得到更高級的特徵。比如圖像的人臉分類：

第一個卷積層，可能只是從原始圖像像素中學習到一些邊緣特徵，第二個卷積層可以從這些邊緣特徵中探測到簡單的形狀特徵，然後接下來的卷積層，就可以用這些簡單的形狀特徵探測到更高級的特徵。比如人臉的形狀。

局部不變性：

所謂局部不變性，比如圖像，就是圖像經過簡單的平移、旋轉、尺度放縮，池化層在相同的位置依舊可以提取到相同的特徵。這是池化層完成的任務。

（1）平移不變性：

假設有一個16x16的圖片，裏面有個數字1，我們需要識別出來，這個數字1可能寫的偏左一點(圖1)，這個數字1可能偏右一點(圖2)，圖1到圖2相當於向右平移了一個單位，但是圖1和圖2經過max pooling之後它們都變成了相同的8x8特徵矩陣，主要的特徵我們捕獲到了，同時又將問題的規模從16x16降到了8x8，而且具有平移不變性的特點。圖中的a（或b）表示，在原始圖片中的這些a（或b）位置，最終都會映射到相同的位置。

（2）旋轉不變性：

下圖表示漢字“一”的識別，第一張相對於x軸有傾斜角，第二張是平行於x軸，兩張圖片相當於做了旋轉，經過多次max pooling後具有相同的特徵。

（3）尺度不變性：

下圖表示數字“0”的識別，第一張的“0”比較大，第二張的“0”進行了較小，相當於作了縮放，同樣地，經過多次max pooling後具有相同的特徵。

注：這三種操作只能保證小幅度的變換，如果變換幅度較大，池化層並不能保證這種局部不變性。

池化層：

maxpooling除了剛剛所講的有局部不變性，還有可以提取顯著特徵的同時降低模型的參數，從而降低模型的過擬合。

因爲只是提取了顯著特徵，而捨棄了不顯著的信息，是的模型的參數減少了，從而一定程度上可以緩解過擬合的產生。

2，yolo v3爲什麼沒有用池化層

3.，1*1 3*3卷積的不同以及優點

4，如何resize Yolo3

參考鏈接：

https://blog.csdn.net/Hearthougan/article/details/83211183?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-26.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-26.nonecase

卷積與池化層區別&YOLOV3三問三答

池化層：

卷積與池化層區別&YOLOV3三問三答

感知器模型詳解

C++讀取特定路徑下文件、創建文件

【OpenCV】中copyto（）函數的使用方法理解

from skimage.measure import compare_ssim error

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結