Pyramidal Person Re-IDentification via Multi-Loss Dynamic Training閱讀筆記

Paper:https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1810.12193.pdf

Code:https://github.com/Klitter/Pyramidal_Person_ReID(侵刪)

摘要:論文指出基於特徵圖水平切塊(part-based)的行人重識別很大程度上依賴於目標檢測算法的優劣。差的目標檢測算法由於無法精確的框出行人,導致在進行局部特徵相似度計算和分類時不準確。 論文提出特徵圖金字塔由粗到細的整合全局和局部特徵,並逐漸集成二者之間的線索,從而緩解了精確Box和不對齊的情況。論文同時指出,多任務訓練可以提升模型的泛化能力,但是在具體的訓練過程中,損失函數的訓練目標往往不一致。在行人重識別中,經常使用交叉熵損失和困難三元組損失同時優化模型參數,根據先驗知識理解,交叉熵損失函數通過優化模型參數,尋找優異的高維分類平面;triplet loss適合在自由的歐式空間里約束。而且對於這兩個損失函數,在訓練剛開始的時候,主要依靠交叉熵損失,等到後期難以識別的樣本出現,現在三元組損失才真正發揮作用。如果簡單地對兩個損失函數賦予固定的權重,就不合適了,因此論文提出動態權重損失函數。

 

知識點解析:

                                 

1):coarse-to-fine的金字塔模型:特徵金字塔--第一層:(1、2、3、4、5、6);第二層:(1、2、3、4、5)和(2、3、4、5、6);第三層:(1、2、3、4)、(2、3、4、5)和(3、4、5、6);第四層:(1、2、3)、(2、3、4)、(3、4、5)和(4、5、6);第五層:(1、2)、(2、3)、(3、4)、(4、5)和(5、6);第六層:(1)、(2)、(3)、(4)、(5)和(6)。得到各個層次的feature map後,將其(注意是所有的部件特徵)分別輸入後續的 Basic Operations,這一步具體操作如上所示,對fenature map分別做GAP和GMP兩種全局池化,將池化後特徵相加(channel不變)並接上conv+bn+relu降維得到最後的feature,這個feature一分爲二,其中一路直接接上FC全連接層+softmax進行ID loss以提高該feature的辨識性,另一路和其他的部件特徵結果相連(concat)進行Triplet Loss。

 

2):Multi Loss Dynamic Training:

                      

在模型參數優化過程中,真正困難樣本逐漸出現,此時困難三元組損失應該獲得更大的權重,因此論文提出動態損失函數,在訓練階段使用不同的損失函數。在每一個epoch中,根據公式計算決定採樣的方式。採樣方式:a):隨機採樣,但是此時三元組可能由於無法找到三元組使得損失函數不起作用;b):K*P採樣:每次選K個身份,每個身份選P個圖像,但是此時由於ID較少,交叉熵損失作用不大。論文沒有進行詳細的論證,效果也需要考究。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章