re-id

  1. Triplet loss(三胞胎損失),更適合用在圖像識別的問題上面

但是他的缺點是:不好訓練

詳見鏈接:https://www.zhihu.com/question/62486208

  1. 圖像檢索:BoF、VLAD、FV三劍客(這些都是傳統的非深度學習的方法),可以參考鏈接:https://yongyuan.name/blog/CBIR-BoF-VLAD-FV.html
  2. Bow的作用只是用在使用傳統算法提取圖像特徵的領域。Bag of words模型(簡稱BOW)是最常用的特徵描述的方法了。在圖像分類和檢索的相關問題中,能夠將一系列數目不定的局部特徵聚合爲一個固定長度的特徵矢量,從而使不同圖像之間能夠進行直接比較。

可以參考這個鏈接:https://blog.csdn.net/jwh_bupt/article/details/17540561

  1. CUHK03:取自5個不同的視角對,共1467個行人的14000多張圖像。這個屬於re-id的數據集。可以參考鏈接:https://blog.csdn.net/yuanchheneducn/article/details/53437005
  2. 模型算力的計算,可以參考鏈接:https://blog.csdn.net/u011501388/article/details/81061024
  3. 行人再識別(re-id)的網絡的訓練是帶有標籤的提取特徵的網絡。用於構建數據庫(gallery)的數據(也就是相當於是測試集數據)是沒有標籤的數據。因爲在使用的時候是很難拿到這個數據的標籤的,所以使用re-id的方法進行構建。

二.Cvpr2018

       21主要講的是消除背景對re-id的影響,與 query 圖片有相似背景但不同行人的圖片排在 rank 6,而同一行人不同背景的圖片卻排在 rank 25。爲了消除背景的干擾,提出了一個網絡,由此還產生出來一個新的數據增廣的方法:對背景進行隨機化。

       22已經被pass裏面講的是同一個人,如果在一個攝像頭裏面檢測不出來,就是用在相近距離的地方的別的攝像頭採集到的圖像,將他們弄成一個視頻,然後再檢測,不適用於咱們的場景。

       23應該也是多爲感知的(沒有細看)

       24將強化學習引入進來,對於判斷對的進行獎勵,判斷錯的進行懲罰,對於不確定的也進行的,進行一些參數的反饋。

三.神經網絡的細節

       1.    假如對於yolo網絡,訓練的時候就有loss的,也就是訓練集的數據是有標籤的。但是測試集是沒有標籤的。Softmax的作用是輸出一個置信度或者說是輸出的爲一個概率。後續對於屬於什麼類別,是自己寫的一些if else的篩選。對於得分高的給它進行歸類,對於得分低的進行pass,就是任何一個圖像(還是圖像的網格)都會出來一個向量

       2.   

四.經驗

       1.對於anchor大小的選擇,可以在訓練之前,對訓練集(因爲訓練集有標籤)的boundingbox進行聚類(比如knn算法或者kmeans),也就是選取被標註圖像的bbox進行聚類,查看原始標註的bbox的大小,再進行對於自己神經網絡裏面的anchor大小的選擇。比如yolo裏面的anchor(先驗框)大小的選擇。詳細的解析可以參考這個鏈接:https://blog.csdn.net/Pattorio/article/details/80095511

      

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章