Faster R-CNN解讀

原創

2020-02-22 09:40

引言

論文：《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》
詳細內容可以參看博客，我只記錄一些我自己的理解。

摘要

1.提出使用RPN網絡替代R-CNN和Fast R-CNN中的區域提取Selective Search
2.採用RPN和Fast R-CNN交替訓練的方式

RPN網絡

網絡結構大致如下，就是傳統的CNN網絡進行multi-task。可以採用ZFnet或者是VGG16net兩種架構。

Anchor

主要記錄一下anchor的概念。
Anchor是設置在原圖上的一些矩形框。RPN進行ROI提取的大致思路就是：對CNN最後一層的feature map進行3*3的滑窗，feature map的每一個節點可以對應原圖上的一個感知區，逐個判斷Anchor是否包含ROI。
論文爲了解決多尺度的問題，設置了9種不同的Anchor。9的來源是：ratio [1:1,1:2,2:1]和scale [128,256,512]的全排列。
Feature Map的每一個節點都對應一個Anchor的中心點，因此，對於ZFnet網絡的Feature Map最後一層輸出是40*60，因此會對應40*60*9=21600個Anchors。需要對每一個anchor判斷是否包含ROI。爲了解決Anchors太多的問題，論文提出使用如下兩個方式進行解決：
1.忽略cross boundary的Anchor。意思就是，如果某一個Anchor與邊緣交叉了，那麼就將這個anchor去掉。這樣的做法是可以理解的，不想將某一個cross boundary的anchor刪除的一個原因是可能這裏出現了obj，但是由於各種scale的anchor遍佈整個原圖，完全會有其他更合適的非cross-boundary的anchor標註該obj，因此刪除。
通過這樣的方式可以將Anchor下降到6000個左右
2.通過非極大抑制算法NMS可以將Anchor 下降到約2000個左右
NMS算法介紹

損失函數

RPN網絡的損失函數介紹如下：

L (p_{i}, t_{i}) = \frac{1}{N_{c l s}} \sum_{i} L_{c l s} (p_{i}, p_{i}^{*}) + λ \frac{1}{N_{r e g}} \sum_{i} p_{i}^{*} L_{r e g} (t_{i}, t_{i} *)

由分類的損失函數和迴歸的損失函數組成（PS: 分類的損失函數指的是判斷anchor內部)
下面分別進行介紹

分類損失函數

\frac{1}{N_{c l s}} \sum_{i} L_{c l s} (p_{i}, p_{i}^{*})

其中，

{\begin{cases} p_{i} & 預測概率 \\ p_{i}^{*} & {\begin{cases} 1 & 正例 \\ 0 & 反例 \end{cases} \\ N_{c l s} & 1個minibatch中的anchor數量 \end{cases}

L_{c l s} 函數是Softmax 函數

迴歸損失函數

λ \frac{1}{N_{r e g}} \sum_{i} p_{i}^{*} L_{r e g} (t_{i}, t_{i} *)

其中

{\begin{cases} p_{i}^{*} & {\begin{cases} 1 & 正例 \\ 0 & 反例 \end{cases} & 目的是計算正例anchor \\ N_{r e g} & anchor的總數量 \end{cases}

L_{r e g} = s m o o t h_{L_{1}} (t_{i}, t_{i}^{*})

其中

s m o o t h_{L_{1}} (x) = {\begin{cases} 0.5 x^{2} & 當|x|<1 \\ | x | - 0.5 & 否 則 \end{cases}

GuanghaoChen

發佈了60 篇原創文章 · 獲贊 37 · 訪問量 13萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Faster R-CNN解讀

引言

摘要

RPN網絡

Anchor

損失函數

分類損失函數

迴歸損失函數

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

LeetCode題解--143. 重排鏈表

佔位符

Python字符串替換

R-CNN論文閱讀筆記

Caltech數據讀取接口

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結