可形變卷積網絡 Deformable ConvNet 論文學習筆記

原創

2020-06-27 19:32

原論文：《J. Dai et al., Deformable Convolutional Networks[C]. 2017 IEEE International Conference on Computer Vision (ICCV), Venice, 2017, pp. 764-773.》
代碼：https://github.com/msracver/Deformable-ConvNets

論文將固定形狀的卷積過程改造成了 能適應物體形狀 的可變的卷積過程，從而提升了特徵提取模塊對物體形變的適應能力。

它對感受野上的每一個點加一個偏移量，而調整後的感受野不再是個正方形，而是與物體的實際形狀相匹配。通過這種方式，無論物體怎麼形變，卷積的區域始終都會覆蓋在物體形狀的周圍。

論文中主要介紹了兩個模塊：可形變卷積(Deformable Convolution) 與 可形變RoI池化(Deformable RoI Pooling)。

1. 可形變卷積

1.1 結構圖

使用一個卷積神經網絡提取特徵圖上每個像素點的 偏移量，然後根據偏移量對特徵圖上每個像素點的位置座標進行調整，再將調整之後的結果進行加權。
對於 $W \times H \times N$ 的特徵圖，這個卷積結構得到的特徵爲： $W \times H \times 2N$ 。其中，2 代表在寬與高兩個方向上的偏移。

1.2 計算公式

$\begin{aligned}\\ y(\pmb{p}_0)&=\sum_{\pmb{p}_n\in \mathcal{R}}\pmb{w}(\pmb{p}_n)\cdot \pmb{\hat{x}}(\pmb{p}_0+\pmb{p}_n+\Delta\pmb{p}_n)\\ &=\sum_{\pmb{p}_n\in \mathcal{R}}\pmb{w}(\pmb{p}_n)\cdot \sum_{\pmb{q}}G(\pmb{q},\pmb{p}_0+\pmb{p}_n+\Delta\pmb{p}_n)\cdot \pmb{x}(\pmb{q})\\ \end{aligned}$
其中， $\pmb{p}$ 與 $\pmb{q}$ 是特徵圖上像素點的座標； $\Delta \pmb{p}_n$ 是 $\pmb{p}_n$ 的偏移量； $\pmb{w}(\pmb{p}_n)$ 是 $\pmb{p}_n$ 對應的權重； $G(\pmb{q},\pmb{p})$ 是雙線性差值公式：
$\begin{aligned}\\ G(\pmb{q},\pmb{p})&=g(q_x,p_x) \cdot g(q_y,q_y)\\ &=max(0,1-|q_x,p_x|) \cdot max(0,1-|q_y,p_y|)\\ \end{aligned}$

2. 可形變RoI池化

RoI 池化用於將任意尺寸的矩形區域轉換爲一個固定尺寸的區域。
對於一個特徵圖 $\pmb{x}$ ，記其左上角位置爲 $\pmb{p}_0$ ，經過 RoI 池化後將得到一個 $k \times k$ 的特徵圖 $\pmb{y}$ ：
$y(i,j)=\sum_{\pmb{p}\in bin(i,j)}\pmb{x}(\pmb{p}_0+\pmb{p})/n_{ij}$

此式表明：RoI 需要將 $\pmb{x}$ 劃分爲 $k\times k$ 個 bin，再在每個 bin 上取均值。 $n_{ij}$ 表示每個bin上的像素點的數量。

2.1 結構圖

利用一般的 RoI 對一個特徵層進行池化；

使用全連接網絡對上面的結果進行處理，得到歸一化的偏移量 $\Delta \hat{\pmb{p}}_{ij}$ ；

在每個元素上進行計算： $\Delta \pmb{p}=0.1\Delta \hat{\pmb{p}}_{ij}\circ(w,h)$ （其實就是將歸一化的量在實際尺寸上進行放縮）；

根據得到的 $\pmb{p}$ 對特徵層進行調整。

2.2 計算公式

$\begin{aligned}\\ y(i,j)&=\sum_{\pmb{p}\in bin(i,j)}\pmb{\hat{x}}(\pmb{p}_0+\pmb{p}+\Delta \pmb{p}_{ij})/n_{ij}\\ &=\sum_{\pmb{p}\in bin(i,j)}\sum_{q} G(\pmb{q},\pmb{p}_0+\pmb{p}_n+\Delta\pmb{p}_n) \cdot \pmb{x}(\pmb{q})/n_{ij}\\ \end{aligned}$

3. 使用方法

直接替換候選骨幹網絡中某個卷積層及 RoI 池化層。

參考材料

Deformable Convolutional Networks解讀

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

可形變卷積網絡 Deformable ConvNet 論文學習筆記

1. 可形變卷積

1.1 結構圖

1.2 計算公式

2. 可形變RoI池化

2.1 結構圖

2.2 計算公式

3. 使用方法

CV中基本卷積函數的變體-花海《深度學習》筆記

Go語言中的goroutine總結

可形變卷積網絡 Deformable ConvNet 論文學習筆記

SSD神經網絡模型學習資料整理

人臉框檢測模型SSH論文學習筆記

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結