目標跟蹤:TLD算法閱讀後記

花了一個星期的時間閱讀完2011年目標跟蹤SOTA算法TLD,從中學習到不少東西,根據回憶記錄下來,可能會有不少紕漏之處。

machine learning應用在目標跟蹤領域

之前我以爲machine learning應用在目標跟蹤領域,應該是挺晚的,沒想到之前的許多跟蹤算法都應用到了。比如隨機森林、聚類算法、binary-classification。文章將TLD框架分解成3個部分:trackinglearningdetecting,其中learningdetecting部分都涉及到了machine learning的分類算法。

特徵選擇

TLD可以看出,以前的算法對圖像特徵的選擇沒有現在這麼豐富。TLD直接在boundingBox內平均選取了若干raw pixels當作特徵點進行跟蹤,raw pixel對光照、形變、遮擋都十分不魯棒,所以TLD在遇到光照變化、物體遮擋和形變時,效果很差。按照今天的思路,HOG肯定要上,起碼行人跟蹤不成問題了,而TLD跟蹤行人效果也是很差的。

相關運算

大概2014年之後,基於相關濾波的跟蹤獨佔鰲頭,速度和精度都上了一個新臺階。但給兩張圖做相關來判定相似程度,在以前的論文中也是常用的。不同的是,以前的論文僅僅將相關的係數與threshold作比較,而沒有進一步發展出相關濾波器。

"傳統的"跟蹤

TLD經常將trackingdetecting分開來說,在TLD之前的算法中,默認tracking是預測物體在下一幀的位置,而不是檢測物體在下一幀的位置。這是很不一樣的。打個比方,tracker根據第一、二幀的圖片,就可以直接預測第三幀中目標的位置;而檢測則只能通過在第三幀中搜索和對比才能知道目標在哪兒。而現在提到跟蹤,已經不在乎trackingdetecting的區別了,因爲他們已經是一體的了。拿KCF舉例,實際上也預測了下一幀的大概位置,就是在當前幀的目標附近;而最終確定目標位置,是通過檢測。

P-N EXPERTS

入鄉隨俗,將trackingdetecting分開來看 P-N 專家。P 專家檢測False Positive Object,即檢測器檢測到的假的目標;然後把假的目標當作負樣本訓練分類器,這樣分類器今後就可以避免再次犯這種樣本帶來的錯誤。N 專家檢測False Negative Object,即跟蹤器跟蹤到的假的背景;然後把假的背景當作正樣本訓練分類器,這樣分類器今後就可以避免再次將這種正樣本判斷成背景的錯誤。P-N EXPERTS輸入TLDlearning部分。

DETECTOR

Detector是以一種窮舉的方式產生大量樣本,然後從樣本中找出誰是目標。Detector的初始樣本可能有幾萬到幾十萬個,然後通過方差、融合分類器和最近鄰分類器最終得到僅僅數個輸出的樣本。據論文介紹,方差對比可將樣本數減少一半,十分高效。但不得不說,這兒的Detector還是太老實了,像KCF一樣在目標周圍弄一個檢測區域,幀率還會提升。

框圖

最後以4個框圖代表TLD的精髓吧
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章