文章標題

文檔OCR-文字區域定位 (Edge Boxes)

標籤:document_processing


  《Edge Boxes: Locating Object Proposals from Edges》是ECCV2014的一篇關於目標檢測的一篇文章,作者是來自於MSRA的 Piotr 等人。本文並沒有涉及到“機器學習”,反之採用的是最原始的圖像處理方法,因爲現在很多提取proposals的文獻,例如BING等,都是基於學習的方法。此外,本文的許多內容,甚至數學公式,都是基於作者的直覺直接建立。一篇學術paper,一般由研究目標,研究方法和實驗結論組成,以下部分分別從這幾方面進行介紹。
  作者爲了加速現有目標檢測算法,提出了一種能夠以較高精度確定proposal的新方法。至於proposal 還沒有一個確定的中文翻譯,一般被稱作“目標可能位置”。這個概念非常重要,當我們看到一幅圖像的時候,我們絕對不會像傳統檢測算法那樣去遍歷圖像,而是一眼“縱觀全局”,直接發現目標“大概的位置”,然後進一步細看。
  這篇文章確定 proposal 的方法的可貴之處就是進一步挖掘了圖像更原始更本質的內容。顯而易見,這樣的方式,速度會很快。
  Pioter 的研究方法:利用邊緣信息(Edge),確定bounding box 內的輪廓個數和與 box 邊緣重疊的輪廓個數(這點很重要,如果我能夠明確一個box內包含的輪廓個數,那麼目標有很大可能性就在這個框中,這也是作者的直覺),並基於此對框框進行評分,進一步根據得分的高低順序確定proposal信息(由大小,長寬比,位置構成)。而後續工作就是在proposal內部運行相關檢測算法。
下面試着詳細介紹本文算法流程。

a(Si,Sj)=|cos(θiθij)cos(θjθij)|γ
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章