機器學習36:YOLOV4相關理論知識整理:
YOLOV4論文:https://blog.csdn.net/Sophia_11/article/details/105726907
YOLOV4論文翻譯:https://blog.csdn.net/qq_34795071/article/details/105734300?fps=1&locationNum=2
機器之心總結:https://www.jiqizhixin.com/articles/2020-04-24-4
極市平臺總結:https://blog.csdn.net/Extremevision/article/details/105731159
1.圖示:
2:最終方案:
(1)CSP Darknet53:
檢測模型需要具有以下特性:
1)更高的輸入分辨率,爲了更好的檢測小目標;
2)更多的層,爲了具有更大的感受野;
3)更多的參數,更大的模型可以同時檢測不同大小的目標。
也就是選擇具有更大感受野、更大參數的模型作爲backbone。下圖可以看到:CSPResNeXt50僅僅包含16個卷積層,其感受野爲425x425,包含20.6M參數;而CSPDarkNet53包含29個卷積層,725x725的感受野,27.6M參數。這從理論與實驗角度表明:CSPDarkNet53更適合作爲檢測模型的Backbone。
(2)SPP:
https://www.cnblogs.com/zongfa/p/9076311.html
(3)PANet:
https://www.sohu.com/a/225356135_129720
(4)YOLOv3 Head
(5)CmBN:創新點
(6)多輸入加權殘差連接(Multi-input weighted residual connections):
在bifpn中,提出了多輸入加權殘差連接以執行按比例的級別重新加權,然後添加不同比例的特徵圖。
bifpn論文: https://arxiv.org/pdf/1911.09070.pdf
(7)Mish:
https://blog.csdn.net/u011984148/article/details/101444274
(8/9)ciouLoss/diouloss:
https://blog.csdn.net/qq_33270279/article/details/103482085
3.訓練方法:數據增強:
(1)Mosaic:創新點
(2)cutmix:
(3)SAT:創新點
(4)Label Smoothing:
https://blog.csdn.net/qq_43211132/article/details/100510113
(5)dropblock:
https://blog.csdn.net/qq_14845119/article/details/85103503
4.訓練方法:策略:
(1)Cosine annealing scheduler:
https://blog.csdn.net/CarryLvan/article/details/104394960
https://blog.csdn.net/zisuina_2/article/details/103250274
(2)Random Training Shapes:
https://blog.csdn.net/qq_33869371/article/details/103076561
https://www.cnblogs.com/Terrypython/p/10642091.html