RACNN筆記

Recurrent attention convolutional neural network for fine-grained image recognition 中的RA-CNN算法不需要對數據做類似bounding box的標註就能取得和採用類似bounding box標註的算法效果。有多個結構相同參數不共享的子網絡對應每個scale。每個子網絡包含分類網絡和APN網絡。對兩個網絡進行教程訓練。 用APN網絡取代了之前的bbox。通過rank 損失函數使得每一層的準確率逐步提升。

在這裏插入圖片描述
每一層將上一層的圖像放大到裁剪前的大小。

訓練過程

先將圖像送入VGG網絡提取特徵,得到的feature map,比如說1414256,然後接一個全連接層,變成111024,然後再接一個全連接層,變成113。3是正方形的座標包括,左上角 的xy,以及框長l。然後把這個框再放大爲224*224後,送入級聯網絡的下一層。放大的時候是用多線性插值的,這樣得到的圖更細緻。
在這裏插入圖片描述
tx ty 是關於x,y的中心點 l是這個正方形的長度的一半

裁剪的計算方法(有利於反向傳播)在這裏插入圖片描述
損失函數
在這裏插入圖片描述
前一項是分類的損失函數,後一項是候選框的損失函數

後面的候選的損失函數
在這裏插入圖片描述
Pt是分類正確的概率,目的是下一層網絡分類正確概率大於上一層網絡得到的分類正確概率。

向着響應方向更新正方形的中心在這裏插入圖片描述
訓練方式:
交叉訓練:設置學習率來達到交替訓練的,一段時間內,APN層的學習率爲0,訓練VGG分類網絡;一段時間內,VGG分類網絡的學習率爲0,訓練APN層。

引用:
https://zhuanlan.zhihu.com/p/36395581

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章