人臉檢測中的bounding box regression詳解

原創

2020-06-24 13:22

0. 引言

在人臉檢測算法如R-CNN、Fast RCNN中都用到了bounding box迴歸，迴歸的目標是使得預測的物體窗口向groundtruth窗口相接近。我一開始沒理解如何能迴歸出一個框來，看完下文就理解了^^

下文轉載自：Faster RCNN解析

1. 爲什麼要做Bounding-box regression？

圖10 示例

如圖10所示，綠色的框爲飛機的Ground Truth，紅色的框是提取的Region Proposal。那麼即便紅色的框被分類器識別爲飛機，但是由於紅色的框定位不準(IoU<0.5)，那麼這張圖相當於沒有正確的檢測出飛機。如果我們能對紅色的框進行微調，使得經過微調後的窗口跟Ground Truth更接近，這樣豈不是定位會更準確。確實，Bounding-box regression 就是用來微調這個窗口的。

2. 迴歸/微調的對象是什麼？

3. Bounding-box regression（邊框迴歸）

那麼經過何種變換才能從圖11中的窗口P變爲窗口呢？比較簡單的思路就是：

注意：只有當Proposal和Ground Truth比較接近時（線性問題），我們才能將其作爲訓練樣本訓練我們的線性迴歸模型，否則會導致訓練的迴歸模型不work（當Proposal跟GT離得較遠，就是複雜的非線性問題了，此時用線性迴歸建模顯然不合理）。這個也是G-CNN: an Iterative Grid Based Object Detector多次迭代實現目標準確定位的關鍵。

線性迴歸就是給定輸入的特徵向量X，學習一組參數W，使得經過線性迴歸後的值跟真實值Y(Ground Truth)非常接近。即。那麼Bounding-box中我們的輸入以及輸出分別是什麼呢？

輸入：

這個是什麼？輸入就是這四個數值嗎？其實真正的輸入是這個窗口對應的CNN特徵，也就是R-CNN中的Pool5feature（特徵向量）。(注：訓練階段輸入還包括 Ground Truth，也就是下邊提到的)

輸出：

需要進行的平移變換和尺度縮放，或者說是。我們的最終輸出不應該是Ground Truth嗎？是的，但是有了這四個變換我們就可以直接得到Ground Truth，這裏還有個問題，根據上面4個公式我們可以知道，P經過，得到的並不是真實值G，而是預測值。

的確，這四個值應該是經過 Ground Truth 和Proposal計算得到的真正需要的平移量和尺度縮放。

這也就是R-CNN中的：

那麼目標函數可以表示爲是輸入Proposal的特徵向量，是要學習的參數（*表示，也就是每一個變換對應一個目標函數），是得到的預測值。我們要讓預測值跟真實值差距最小，得到損失函數爲：

函數優化目標爲：

利用梯度下降法或者最小二乘法就可以得到。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

論文筆記之Structural Deep Network Embedding

本論文是kdd2016的一篇論文主要的目的也是做node embedding。主要的想法就是通過deep autoencode對node進行embedding，不過在在embedding的時候不僅考慮了1-hop的信息而且考慮

2020-07-08 10:23:34

論文筆記之Fully Convolutional Networks for Semantic Segmentation

最近了解到了Image Semantic Segmentation方面的知識，在此做一個記錄。這篇論文是2015cvpr的best paper，可以說是在cnn上做圖像語義分割的開山之作。 1.語義分割定義：語義就是指物體的

2020-07-08 10:23:34

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications論文閱讀筆記

論文地址：MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet是爲移動和嵌入式設備提出的輕量級網絡

2020-07-07 12:29:52

【Paper Note】Representation Learning-Assisted Click-Through Rate Prediction (DeepMCP) 論文詳解

https://arxiv.org/pdf/1906.04365.pdf 背景以往的點擊率預估模型像FM系列、WDN等模型，都只是考慮特徵和ctr之間的聯繫，阿里的這篇論文，提出了DeepMCP模型，不僅考慮了特徵和ctr之間

2020-07-07 01:30:56

論文筆記——Federated learning framework for mobile edge computing networks

論文筆記——Federated learning framework for mobile edge computing networks 本論文着重研究的是聯邦學習應用於需求預測類問題。一般來說，FL存在的一些問題：非獨立同分布數據

2020-07-06 10:38:33

WWW19 A First Look at Deep Learning Apps on Smartphones

這篇文章有點像行業調查，對目前市場上APP中DL的各個特性進行統計，調研時間從2018.06 ～ 2018.09 大約三個月的時間，作者也說了後續會繼續跟進。作者製作了一個可以嗅探Android apk中DL的軟件，同時對APP

2020-07-06 03:56:57

【論文筆記-AAAI2020】Overcoming Language Priors in VQA via Decomposed Linguistic Representations

這篇博客會大概講解一下論文的工作，以及一些VQA 領域的近況，也會涉及到一些自己的見解。一些容易誤解的地方，我會盡量的表達細緻，方便讀者理解。如果需要深入研究，推薦自行再品讀該論文：https://jingchenchen.git

2020-07-05 19:21:39

[NIPS 2019] Multi-Agent Common Knowledge Reinforcement Learning筆記

文章目錄前言IntroductionProblem settingCommon knowledgeLearning under common knowledge (LuCK)Field-of-view common knowled

强殖装甲凯普

2020-07-05 06:05:25

【論文筆記】TensorFlow深度神經網絡提前穩定特徵重要性

論文地址：Early Stabilizing Feature Importance for TensorFlow Deep Neural Networks 博客裏只給出一下論文中介紹的方法這一章節，論文中前面介紹了神經網絡中特徵

2020-07-05 01:13:40

AI大廠算法測試心得：人臉識別關鍵指標有哪些？

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！僅僅在幾年前，程序員要開發一款人臉識別應用，就必須精通算法的編寫。但現在，隨着成熟算法的對外開放，越來越多開發者只需專注於開發垂直行業的產

雲棲號資訊小哥

2020-07-29 13:43:51

人臉檢測之RetinaFace

論文：RetinaFace: Single-stage Dense Face Localisation in the Wild 代碼：https://github.com/deepinsight/insightface/tree/ma

2020-07-08 05:19:36

傳統人臉檢測算法論文閱讀筆記

梳理： A Convolutional Neural Network Cascade for Face Detection是CNN與級聯思想在檢測的應用 From Facial Parts Responses to Face Detect

帅气的小王子

2020-07-06 08:41:55

人臉集數據庫

數據集圖片數量人臉數量關鍵點數量主要用途優點缺點適用方法 AFLW 16k 25k 21（點不全）/85 （點全，但無側臉）人臉檢測／人臉矯正包含各種自然情況下的人臉（多角度、年齡、

帅气的小王子

2020-07-06 08:41:55

VOC文件 TFRecord文件生成\轉換

1、VOC數據集、TFRecord文件是什麼？ VOC數據集是一種數據集文件存放的標準格式，滿足這種格式的就是VOC數據集。博客園：https://www.cnblogs.com/sdu20112013/p/10801383.html

2020-07-05 22:26:22

spark構建迴歸模型

Spark機器學習第六章實現加載數據集數據集爲Bike-Sharing-Dataset path = "hdfs:///user/yy/Bike-Sharing-Dataset/hour_noheader.csv" raw_

2020-07-06 13:47:14

24小時熱門文章

最新文章

最新評論文章