Introduction

如果直接將分類網絡運用於Person Re-ID任務的話將會有幾大缺點：

本文的貢獻主要有兩點：

Approach

改造網絡，將最後的全連接層替換爲卷積層和global pooling層。比如AlexNet，將最後的fc7和fc8替換爲卷積層和global pooling層。卷積層的通道數爲訓練集的分類個數，加上global pooling之後就相當於得到屬於每類的描述符，然後用softmax分類。

在inference階段，去掉替換的層，只用前面的卷積層的輸出作爲feature map，因此不依賴訓練集的類別數，泛化能力更好。然後對這一層的feature做global pooling得到全局特徵，即1024維特徵，然後經過PCA降維得到128維的特徵。

局部特徵的提取和全局特徵類似，只是將輸入圖像等分成4部分，由於提特徵網絡是個全卷積網絡，因此輸入圖像的大小可以隨意，因此將每部分分別輸入網絡都會得到1024維的特徵（未用PCA降維）。

整個coarse-to-fine的過程是先線下提取gallery的全局特徵和局部特徵。coarse階段先對query中的圖像提取全局特徵，從gallery中挑選排名前500的圖像，fine階段對query圖像提取局部特徵與挑選出的500張圖像的局部特徵進行對比。

第一個實驗是對比改造後的網絡性能對比

第二個實驗是加入fine-level的性能對比

點評：這種方法訓練起來比較簡單，但應該算不上真正意義上的coarse-to-fine，因爲fine-level用的還是coarse網絡，沒有對各個部分分別進行訓練。另外這種分成4部分的做法也顯得很粗糙。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.