文章標題

文章標題

原創

2018-09-01 05:49

文檔OCR-文字區域定位 (Edge Boxes)

標籤：document_processing

《Edge Boxes: Locating Object Proposals from Edges》是ECCV2014的一篇關於目標檢測的一篇文章，作者是來自於MSRA的 Piotr 等人。本文並沒有涉及到“機器學習”，反之採用的是最原始的圖像處理方法，因爲現在很多提取proposals的文獻，例如BING等，都是基於學習的方法。此外，本文的許多內容，甚至數學公式，都是基於作者的直覺直接建立。一篇學術paper，一般由研究目標，研究方法和實驗結論組成，以下部分分別從這幾方面進行介紹。
作者爲了加速現有目標檢測算法，提出了一種能夠以較高精度確定proposal的新方法。至於proposal 還沒有一個確定的中文翻譯，一般被稱作“目標可能位置”。這個概念非常重要，當我們看到一幅圖像的時候，我們絕對不會像傳統檢測算法那樣去遍歷圖像，而是一眼“縱觀全局”，直接發現目標“大概的位置”，然後進一步細看。
這篇文章確定 proposal 的方法的可貴之處就是進一步挖掘了圖像更原始更本質的內容。顯而易見，這樣的方式，速度會很快。
Pioter 的研究方法：利用邊緣信息（Edge），確定bounding box 內的輪廓個數和與 box 邊緣重疊的輪廓個數（這點很重要，如果我能夠明確一個box內包含的輪廓個數，那麼目標有很大可能性就在這個框中，這也是作者的直覺），並基於此對框框進行評分，進一步根據得分的高低順序確定proposal信息（由大小，長寬比，位置構成）。而後續工作就是在proposal內部運行相關檢測算法。
下面試着詳細介紹本文算法流程。

a (S i, S j) = | c o s (θ i - θ i j) c o s (θ j - θ i j) | γ

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

文檔OCR-文字區域定位 (Edge Boxes)

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

歡迎使用CSDN-markdown編輯器

C++中的 & 與 &&

文章標題

林軒田（learning from data note）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結