目標跟蹤：TLD算法閱讀後記

原創

2020-04-30 20:19

花了一個星期的時間閱讀完2011年目標跟蹤SOTA算法TLD，從中學習到不少東西，根據回憶記錄下來，可能會有不少紕漏之處。

machine learning應用在目標跟蹤領域

之前我以爲machine learning應用在目標跟蹤領域，應該是挺晚的，沒想到之前的許多跟蹤算法都應用到了。比如隨機森林、聚類算法、binary-classification。文章將TLD框架分解成3個部分：tracking，learning，detecting，其中learning和detecting部分都涉及到了machine learning的分類算法。

特徵選擇

從TLD可以看出，以前的算法對圖像特徵的選擇沒有現在這麼豐富。TLD直接在boundingBox內平均選取了若干raw pixels當作特徵點進行跟蹤，raw pixel對光照、形變、遮擋都十分不魯棒，所以TLD在遇到光照變化、物體遮擋和形變時，效果很差。按照今天的思路，HOG肯定要上，起碼行人跟蹤不成問題了，而TLD跟蹤行人效果也是很差的。

"傳統的"跟蹤

TLD經常將tracking和detecting分開來說，在TLD之前的算法中，默認tracking是預測物體在下一幀的位置，而不是檢測物體在下一幀的位置。這是很不一樣的。打個比方，tracker根據第一、二幀的圖片，就可以直接預測第三幀中目標的位置；而檢測則只能通過在第三幀中搜索和對比才能知道目標在哪兒。而現在提到跟蹤，已經不在乎tracking和detecting的區別了，因爲他們已經是一體的了。拿KCF舉例，實際上也預測了下一幀的大概位置，就是在當前幀的目標附近；而最終確定目標位置，是通過檢測。

P-N EXPERTS

入鄉隨俗，將tracking和detecting分開來看 P-N 專家。P 專家檢測False Positive Object，即檢測器檢測到的假的目標；然後把假的目標當作負樣本訓練分類器，這樣分類器今後就可以避免再次犯這種樣本帶來的錯誤。N 專家檢測False Negative Object，即跟蹤器跟蹤到的假的背景；然後把假的背景當作正樣本訓練分類器，這樣分類器今後就可以避免再次將這種正樣本判斷成背景的錯誤。P-N EXPERTS輸入TLD的learning部分。

DETECTOR

Detector是以一種窮舉的方式產生大量樣本，然後從樣本中找出誰是目標。Detector的初始樣本可能有幾萬到幾十萬個，然後通過方差、融合分類器和最近鄰分類器最終得到僅僅數個輸出的樣本。據論文介紹，方差對比可將樣本數減少一半，十分高效。但不得不說，這兒的Detector還是太老實了，像KCF一樣在目標周圍弄一個檢測區域，幀率還會提升。

框圖

最後以4個框圖代表TLD的精髓吧

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

目標跟蹤：TLD算法閱讀後記

machine learning應用在目標跟蹤領域

特徵選擇

相關運算

"傳統的"跟蹤

P-N EXPERTS

DETECTOR

框圖

JavaScript：可視區寬度、元素寬高等

JavaScript：自定義滾動條

JavaScript：帶框拖拽

SpringBoot：wamp橙色問題

springboot：自動生成mybatis-plus代碼

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結