- VGG
- Resnet
- Inception V1-v3
- Densnet
- ResnXt
- SENet
- NAS
- 下面四個都是輕量化模型
- MobileNet V1-V2
- mobileNet V3(novel):https://arxiv.org/pdf/1905.02244.pdf
- Xception
- shufflenet V1-V2
- squeezenet
- group convolution
- SEResNet,SEResNeXt
- NAS
- EfficientNet
知識點包括:BN的作用,1X1卷積作用,深度分離卷積理解
VGG
-
這樣組合了三個非線性函數,使得決策函數更有表徵能力
-
參數數量減少了81%,而感受野保持不變
-
使得網絡可以變得更深
ResNet
-
跳遠連接skipconnection不會增加參數數量,可以獲得穩定的訓練和顯著性能提升
-
1x1用於減少輸出通道個數
-
在每次卷積 完成後,激活進行前都有個BN操作
-
刪除了全連接,並使用平均池化層減少參數數量,由於網絡深,卷積層抽象能力強,從而減少了對全連接的需求
-
加快訓練速度增大學習率
-
減小梯度消失和梯度爆炸
-
控制過擬合,可以少用或者不用dropout和正則
-
降低網絡對初始權重不敏感
GoogleNet
-
使用1x1卷積來進行升降維並進行非線性化,注意1x1卷積作用
-
降維/升維
-
減少卷積核參數,降低計算複雜度
-
加入非線性,提升網絡表達能力(每個1X1後有個激活)
-
跨通道的信息角交互和信息整合
-
-
在多個尺寸上同時進行卷積再聚合(增加了特徵多樣性)。直觀上感覺在多個尺度上同時進行卷積,能提取到不同尺度的特徵,特徵更豐富以爲最後分類判斷時更準確
Inception V1
-
網絡中有3個softmax,爲了減輕深層網絡反向傳播時梯度消失的影響。就是說整個網絡由3個softmax共同組成損失,這樣在反向傳播時,即使最後一個softmax傳播回來的梯度消失,還有前兩個softmax傳播回來的梯度輔助,測試時額外softmax會拿下。這樣不僅減輕了梯度消失的影響,而且加速了網絡的收斂
-
採用了average pooling來代替全連接層,減少參數
-
使用Inception模塊提高參數的利用效率,使用1X1卷積減小計算成本
Inception V2
-
用2個連續的3X3卷積組成的小網絡來代替單個的5X5卷積,即在保證感受野範圍同時減少了參數量
-
任意nxn卷積都可通過1xn卷積後接nx1卷積來代替。這種分解方法在網絡前期使用效果不好,在中度大小的特徵圖上效果會更好(12~20之間最好)
-
使用兩個並行化的卷積降低計算量( 卷積、池化並行執行,再進行合併)
Inception V3:
-
Inception V3最重要的改機你是分解(Factorization),將7x7卷積分解成兩個一維卷積(1x7,7x1),3x3(1x3,3x1)。這樣好處既可以加速計算,又可以將1個卷積拆成2個卷積,使得網深度進一步增加,增加了網絡非線性(每層都要Relu)
-
網絡輸入從224x224變爲299x299
-
輔助分類器加入BN
-
使激活函數能夠更有效的利用輸入信息
-
隨着模型訓練,能夠學習每層輸入分佈
-
使內部協方差變小,加速訓練過程
-
有效減緩梯度消失
-
-
RMSProp優化器
-
標籤平滑(添加到損失公式的一種正則化項,旨在阻止網絡對某一類別過分自信)
inception V4:
Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
DensNet
-
網絡中,任何兩層之間都有直接連接,即網絡每層輸入都是前面所有層輸出的並集,該層學習的特徵圖也會被直接傳給其後面所有層作爲輸入
-
Densnet比其他網絡效率更高,關鍵就在於網絡每層計算量的減少及其特徵的重複利用,每層都包含之前所有層輸出,只需要很少特徵圖就夠,這就是參數量少的原因
Xception
-
Inception出發點,用多尺寸卷積觀察輸入數據,還有就是用多個小卷積核替代大卷積核。
-
Pointwise Conv,用1x1卷積做數據降維減少參數量(也可以升維,豐富數據特徵。同時加個激活函數,增加非線性特徵)
-
卷積核替換,5x5替換成2個3x3,7x7替換成1x7和7x1
-
Bottleneck,利用多個小卷積替代一個大卷積
-
Depthwise Separable Conv:深度可分卷積,再減少參數量
-
深度卷積部分:大小爲(4,4,1,3) ,作用在輸入的每個通道上,輸出特徵映射爲(3,3,3)
-
逐點卷積部分:大小爲(1,1,3,5),作用在深度卷積的輸出特徵映射上,得到最終輸出爲(3,3,5)