RACNN筆記

RACNN筆記

原創

2020-07-03 17:24

Recurrent attention convolutional neural network for fine-grained image recognition 中的RA-CNN算法不需要對數據做類似bounding box的標註就能取得和採用類似bounding box標註的算法效果。有多個結構相同參數不共享的子網絡對應每個scale。每個子網絡包含分類網絡和APN網絡。對兩個網絡進行教程訓練。用APN網絡取代了之前的bbox。通過rank 損失函數使得每一層的準確率逐步提升。

每一層將上一層的圖像放大到裁剪前的大小。

訓練過程

先將圖像送入VGG網絡提取特徵，得到的feature map，比如說1414256，然後接一個全連接層，變成111024，然後再接一個全連接層，變成113。3是正方形的座標包括，左上角的xy,以及框長l。然後把這個框再放大爲224*224後，送入級聯網絡的下一層。放大的時候是用多線性插值的，這樣得到的圖更細緻。

tx ty 是關於x，y的中心點 l是這個正方形的長度的一半

裁剪的計算方法（有利於反向傳播）
損失函數

前一項是分類的損失函數，後一項是候選框的損失函數

後面的候選的損失函數

Pt是分類正確的概率，目的是下一層網絡分類正確概率大於上一層網絡得到的分類正確概率。

向着響應方向更新正方形的中心
訓練方式：
交叉訓練：設置學習率來達到交替訓練的，一段時間內，APN層的學習率爲0，訓練VGG分類網絡；一段時間內，VGG分類網絡的學習率爲0，訓練APN層。

引用：
https://zhuanlan.zhihu.com/p/36395581

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

訓練過程

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

RCNN，SSD， YOLO的優缺點比較及反思

【YOLO V4】速度和準確度更優的目標檢測並附源碼

語義分割看這一篇就夠了！

花書-無約束優化

RACNN筆記

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結