【每日一網】Day22:Crafting GBD-Net for Object Detection簡單理解

GBD-Net

明天考試今天簡單理解理解吧

算法背景

物體檢測中,不同大小和分辨率的多個proposal的特徵細節在進行分類的時候是互補的,來自這些proposal的上下文特徵的整合是目標檢測中的基本問題,在本文中,作者提出了一種門控雙向神經網絡(GBD網絡),用於在特徵學習和特徵提取的過程中在來自不同proposal的特徵之間傳遞信息。這種信息傳遞可以通過兩個方向上相鄰的proposal之間的卷積來實現,並且可以在不同層之中進行。

算法原理

在這裏插入圖片描述
在不同分辨率的proposal之間根據不同的圖像實例來控制傳遞信息是非常必要的,藍色框代表GT,紅色框是候選框,由於(a)中相似的局部特徵和(b)中對遮擋區域的忽略,很難對proposal進行分類。
作者的思路就是來自不同分辨率和proposal的特徵驗證彼此的存在,例如兔子耳朵在局部區域的存在有助於加強兔子頭的存在,而兔子上半身在更大的context區域存在也有助於驗證兔子頭的存在,因此作者建議具有不同分辨率和proposal的特徵應該在多個層中互相傳遞信息,以便於在特徵學習和特徵提取過程中共同驗證。

網絡結構

在這裏插入圖片描述
GBD-Net採集Context信息的方式是直接在目標窗口基礎上放大窗口以獲得更多的context信息,或縮小窗口以保留更多的目標細節,以此得到多個support region,雙向連接的網絡讓不同尺度和分辨率的信息在每個support region之間相互傳遞,從而綜合學習到最優的特徵。然而如研究動機中所說,並非所有的上下文信息都能給決策帶來“正能量”,所以在雙向互通的連接上都加了一個“門”,以此控制context信息的相互傳播。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章