論文下載地址:https://arxiv.org/pdf/1807.06521.pdf
論文代碼:https://github.com/ziweizhan/CBAM
論文創新:論文核心是提出了新的通道注意力網絡結構和空間注意力網絡結構。這兩個網絡結構簡單不會影響網絡檢測速度,還可以將注意力網絡結構嵌入到任何CNN網絡裏面,適應性強。
網絡結構:
整體網絡結構:
如下圖所示是網絡的整體網絡結構,提取到的 Input Feature 特徵圖先經過通道注意力結構得到通道注意力特徵圖F1,然後F1再和 Input Feature 進行元素相乘操作得到 F2, F2再傳入空間注意力模型得到 F3,然後F3再和F2進行一次元素相乘操作得到最後的注意力特徵圖。
圖1 . CBAM整體網絡結構
通道注意力模塊:
如下圖所示通道注意力網絡結構。作者通過大量的實驗證實在提取通道特徵的時候同時使用最大池化加平均池化操作可以取得最好的效果。結構的整體流程是,首先將F特徵圖分別傳到最大池化和均值池化分別得到兩類特徵圖,然後再將特徵圖分別傳送到MLP(只包含一層隱藏層的簡單多層感知機裏面),得到兩類特徵圖F1和F2。最後再將這兩類特徵圖進行相加操作得到最後的通道注意力特徵圖。
圖2 . 通道注意力網絡結構
公式如下圖所示,σ表示的是Sigmod激活函數。
公式1 . 通道注意力公式
空間注意力模塊:
如圖3所示,空間注意力網絡結構主要有池化層和卷積層做成。網絡整體流程是,首先將通道注意力網絡處理之後的特徵圖傳到最大池化和均支持華里面得到兩類特徵圖F1和F2,然後再將F1和F2,通過通道維度Concate在一起。最後再經過一個7*7的卷積層處理得到最後的空間注意力特徵圖。
圖3 . 空間注意力網絡結構
公式2 . 空間注意力公式
實驗結果:
作者還做了大量的實驗來證明提出的網絡結構最優。
作者通過實驗發現同時使用最大池化和均值池化可以提升結果。
作者通過使用不同注意力模塊、不同卷積核的卷積、不同的最大和均值池化來證明當前網絡結構是最優。
作者通過對比通道注意力和空間注意力模塊的順序得到通道注意力後面接一個空間注意力是最好的結果。