re-id

re-id

原創

qinglv1

2020-06-16 06:33

Triplet loss(三胞胎損失)，更適合用在圖像識別的問題上面

但是他的缺點是：不好訓練

詳見鏈接：https://www.zhihu.com/question/62486208

圖像檢索：BoF、VLAD、FV三劍客(這些都是傳統的非深度學習的方法)，可以參考鏈接：https://yongyuan.name/blog/CBIR-BoF-VLAD-FV.html
Bow的作用只是用在使用傳統算法提取圖像特徵的領域。Bag of words模型（簡稱BOW）是最常用的特徵描述的方法了。在圖像分類和檢索的相關問題中，能夠將一系列數目不定的局部特徵聚合爲一個固定長度的特徵矢量，從而使不同圖像之間能夠進行直接比較。

可以參考這個鏈接：https://blog.csdn.net/jwh_bupt/article/details/17540561

CUHK03：取自5個不同的視角對，共1467個行人的14000多張圖像。這個屬於re-id的數據集。可以參考鏈接：https://blog.csdn.net/yuanchheneducn/article/details/53437005
模型算力的計算，可以參考鏈接：https://blog.csdn.net/u011501388/article/details/81061024
行人再識別(re-id)的網絡的訓練是帶有標籤的提取特徵的網絡。用於構建數據庫(gallery)的數據(也就是相當於是測試集數據)是沒有標籤的數據。因爲在使用的時候是很難拿到這個數據的標籤的，所以使用re-id的方法進行構建。

二．Cvpr2018

21主要講的是消除背景對re-id的影響，與 query 圖片有相似背景但不同行人的圖片排在 rank 6，而同一行人不同背景的圖片卻排在 rank 25。爲了消除背景的干擾，提出了一個網絡，由此還產生出來一個新的數據增廣的方法：對背景進行隨機化。

22已經被pass裏面講的是同一個人，如果在一個攝像頭裏面檢測不出來，就是用在相近距離的地方的別的攝像頭採集到的圖像，將他們弄成一個視頻，然後再檢測，不適用於咱們的場景。

23應該也是多爲感知的(沒有細看)

24將強化學習引入進來，對於判斷對的進行獎勵，判斷錯的進行懲罰，對於不確定的也進行的，進行一些參數的反饋。

三．神經網絡的細節

1. 假如對於yolo網絡，訓練的時候就有loss的，也就是訓練集的數據是有標籤的。但是測試集是沒有標籤的。Softmax的作用是輸出一個置信度或者說是輸出的爲一個概率。後續對於屬於什麼類別，是自己寫的一些if else的篩選。對於得分高的給它進行歸類，對於得分低的進行pass，就是任何一個圖像(還是圖像的網格)都會出來一個向量

四．經驗

1.對於anchor大小的選擇，可以在訓練之前，對訓練集(因爲訓練集有標籤)的boundingbox進行聚類(比如knn算法或者kmeans)，也就是選取被標註圖像的bbox進行聚類，查看原始標註的bbox的大小，再進行對於自己神經網絡裏面的anchor大小的選擇。比如yolo裏面的anchor(先驗框)大小的選擇。詳細的解析可以參考這個鏈接：https://blog.csdn.net/Pattorio/article/details/80095511

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Win10 LTSC 2019 安裝後的一些步驟

推薦2款開源、美觀的WinForm UI控件庫

NET9 AspnetCore將整合OpenAPI的文檔生成功能而無需三方庫

在Linux下管理MySQL的大小寫敏感性

re-id

利用opencv檢測移動的物體----mog2()

尋找一個數組裏面的第k大的數字，python

零散筆記

如何解決機器學習裏面的類別不平衡問題

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結