機器學習36:YOLOV4相關理論知識整理

機器學習36:YOLOV4相關理論知識整理:

        YOLOV4論文:https://blog.csdn.net/Sophia_11/article/details/105726907

        YOLOV4論文翻譯:https://blog.csdn.net/qq_34795071/article/details/105734300?fps=1&locationNum=2

        機器之心總結:https://www.jiqizhixin.com/articles/2020-04-24-4

        極市平臺總結:https://blog.csdn.net/Extremevision/article/details/105731159

1.圖示:

2:最終方案:

(1)CSP Darknet53:

         檢測模型需要具有以下特性:

            1)更高的輸入分辨率,爲了更好的檢測小目標;

            2)更多的層,爲了具有更大的感受野;

            3)更多的參數,更大的模型可以同時檢測不同大小的目標。

         也就是選擇具有更大感受野、更大參數的模型作爲backbone。下圖可以看到:CSPResNeXt50僅僅包含16個卷積層,其感受野爲425x425,包含20.6M參數;而CSPDarkNet53包含29個卷積層,725x725的感受野,27.6M參數。這從理論與實驗角度表明:CSPDarkNet53更適合作爲檢測模型的Backbone。

 

(2)SPP:

         https://www.cnblogs.com/zongfa/p/9076311.html

(3)PANet:

         https://www.sohu.com/a/225356135_129720

(4)YOLOv3 Head

(5)CmBN:創新點

(6)多輸入加權殘差連接(Multi-input weighted residual connections):

          在bifpn中,提出了多輸入加權殘差連接以執行按比例的級別重新加權,然後添加不同比例的特徵圖。

          bifpn論文: https://arxiv.org/pdf/1911.09070.pdf

(7)Mish:

         https://blog.csdn.net/u011984148/article/details/101444274

(8/9)ciouLoss/diouloss:

         https://blog.csdn.net/qq_33270279/article/details/103482085

 

3.訓練方法:數據增強:

(1)Mosaic:創新點

(2)cutmix:

         https://blog.csdn.net/weixin_38715903/article/details/103999227#1.幾種數據增強的區別%3AMixup%2CCutout%2CCutMix

(3)SAT:創新點

(4)Label Smoothing:

         https://blog.csdn.net/qq_43211132/article/details/100510113

(5)dropblock:

         https://blog.csdn.net/qq_14845119/article/details/85103503

 

4.訓練方法:策略:

(1)Cosine annealing scheduler:

         https://blog.csdn.net/CarryLvan/article/details/104394960

         https://blog.csdn.net/zisuina_2/article/details/103250274

 

(2)Random Training Shapes:

         https://blog.csdn.net/qq_33869371/article/details/103076561

         https://www.cnblogs.com/Terrypython/p/10642091.html

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章