論文筆記:Mask R-CNN
1.簡介
MASK RCNN是ICCV 2017 best paper。這篇文章提出了一個二階段的實例分割網絡,能以像素級精度分割出每一個不同的個體。
2.設計思路
這是一個兩階段的方法,第一階段通過RPN網絡提出一些可能的區域,第二階段在每一個區域裏面進行分類和迴歸,對於每一個區域都得到一個分類結果、一組邊框offset和K個mask(K爲總的類別數),第二階段的三個任務同時進行,最後只取與類別對應的mask作爲最終的mask。
3.具體實現方法
3.1網絡結構
網絡分爲backbone和head兩部分,分別完成region proposal和分類+邊框預測+mask預測。backbone採用resnet-50-C4或者FPN,head使用全卷積神經網絡。
3.2 RoIAlign
不同於faster rcnn使用的RoIPooling,RoIAlign通過雙線性差值的方法找RoI對應的區域,避免了量化(使用取整函數)過程中造成的邊界誤差。
3.3 損失函數
其中只計算對應類別的loss。