【Person Re-ID】Large-scale Person Re-identification as Retrieval

paper下載地址:http://www.yaohantao.com/cv/paper_671.pdf

code下載地址:https://github.com/coldrainyht/ICME2017

Introduction

如果直接將分類網絡運用於Person Re-ID任務的話將會有幾大缺點:

  • 訓練一個分類網絡需要大量的數據,Re-ID任務目前沒有特別大的數據集。
  • 分類網絡最後一層的神經元個數與訓練集的分類個數有關,且參數量較大。

本文的貢獻主要有兩點:

  • 將卷積網絡的最後一層全連接層換成卷積層和global pooling層,適用於不同的Re-ID任務。(常用技倆)
  • 採用coarse-to-fine的策略,縮小搜索空間,達到更好的判別性。

Approach

改造網絡,將最後的全連接層替換爲卷積層和global pooling層。比如AlexNet,將最後的fc7和fc8替換爲卷積層和global pooling層。卷積層的通道數爲訓練集的分類個數,加上global pooling之後就相當於得到屬於每類的描述符,然後用softmax分類。

在inference階段,去掉替換的層,只用前面的卷積層的輸出作爲feature map,因此不依賴訓練集的類別數,泛化能力更好。然後對這一層的feature做global pooling得到全局特徵,即1024維特徵,然後經過PCA降維得到128維的特徵。

局部特徵的提取和全局特徵類似,只是將輸入圖像等分成4部分,由於提特徵網絡是個全卷積網絡,因此輸入圖像的大小可以隨意,因此將每部分分別輸入網絡都會得到1024維的特徵(未用PCA降維)。

整個coarse-to-fine的過程是先線下提取gallery的全局特徵和局部特徵。coarse階段先對query中的圖像提取全局特徵,從gallery中挑選排名前500的圖像,fine階段對query圖像提取局部特徵與挑選出的500張圖像的局部特徵進行對比。

Experiment

第一個實驗是對比改造後的網絡性能對比

  • 改造過的網絡性能要比原始網絡要好不少。
  • 輸入圖像變大,性能有提升。

第二個實驗是加入fine-level的性能對比

點評:這種方法訓練起來比較簡單,但應該算不上真正意義上的coarse-to-fine,因爲fine-level用的還是coarse網絡,沒有對各個部分分別進行訓練。另外這種分成4部分的做法也顯得很粗糙。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章