GBD-Net

明天考試今天簡單理解理解吧

算法背景

物體檢測中，不同大小和分辨率的多個proposal的特徵細節在進行分類的時候是互補的，來自這些proposal的上下文特徵的整合是目標檢測中的基本問題，在本文中，作者提出了一種門控雙向神經網絡（GBD網絡），用於在特徵學習和特徵提取的過程中在來自不同proposal的特徵之間傳遞信息。這種信息傳遞可以通過兩個方向上相鄰的proposal之間的卷積來實現，並且可以在不同層之中進行。

算法原理

在不同分辨率的proposal之間根據不同的圖像實例來控制傳遞信息是非常必要的，藍色框代表GT，紅色框是候選框，由於（a）中相似的局部特徵和（b）中對遮擋區域的忽略，很難對proposal進行分類。
作者的思路就是來自不同分辨率和proposal的特徵驗證彼此的存在，例如兔子耳朵在局部區域的存在有助於加強兔子頭的存在，而兔子上半身在更大的context區域存在也有助於驗證兔子頭的存在，因此作者建議具有不同分辨率和proposal的特徵應該在多個層中互相傳遞信息，以便於在特徵學習和特徵提取過程中共同驗證。

網絡結構

GBD-Net採集Context信息的方式是直接在目標窗口基礎上放大窗口以獲得更多的context信息，或縮小窗口以保留更多的目標細節，以此得到多個support region，雙向連接的網絡讓不同尺度和分辨率的信息在每個support region之間相互傳遞，從而綜合學習到最優的特徵。然而如研究動機中所說，並非所有的上下文信息都能給決策帶來“正能量”，所以在雙向互通的連接上都加了一個“門”，以此控制context信息的相互傳播。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【每日一網】Day22：Crafting GBD-Net for Object Detection簡單理解

GBD-Net

算法背景

算法原理

網絡結構

區塊鏈學習(0)--以太坊智能合約概論

Starcity收購Ollie，加速其作爲全球垂直一體化共享居住公司的成長步伐

【NiosII學習】第一篇、如何燒錄NiosII工程

在阿里淘系6個月能有哪些收穫成長？

RFM模型：量化你的用戶價值！

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結