深度學習基礎(一):windows下視頻數據半自動化標註工具

目錄

1.數據認知

2.標註工具

3.參考資料


1.數據認知

       原本認爲這一塊應當會有很多比較成熟的開源軟件,但是實際情況好像並非想象這樣,單純基於圖像的標註工具較多,但是視頻類相對較少。

     看到很多簡單場景下的視頻數據標註,仍然採用傳統的全人工標註,效率低下數據標註不僅造成資金浪費,更會拖沓開發進度。半自動化標註在很多場景下效率至少是人工的效率的10倍以上,我們爲何不嘗試呢?算法人員應當投入更多精力到數據採集、數據標註和數據清洗過程中去,深入瞭解生產環境和應用場景,相信這會對業務大有裨益。

       就一般的識別和檢測的場景數據,現階段數據獲取的手段主要有:1、部署硬件採集設備,主要爲彩色相機和深度相機 2、實驗室模擬真實環境,進行高仿真採集3、網上爬蟲爬取相關數據,然後進行數據清洗 4、將目標元素和背景合成,僞造數據。5、使用數據增強技術,擴充數據集。無論如何我們應當收集並構建一個無限接近實際場景的數據集,個人認爲:數據集的構建是算法業務的起跑線,數據是資產,是分水嶺,是門檻。技術以服務產品爲使命,而非追求酷炫和繁雜,而技術又應當從整個開發全流程的每一個模塊,每一個細節去優化與權衡,雖然抵達烏托邦的路途遙遠艱辛,但是心嚮往之。

2.標註工具

     考慮到很多外包數據標註人員的實際情況,主要調研了基於windows下半自動化視頻數據標註工具。半自動化標註工具現階段主要採用基於追蹤算法和檢測算法自動標註出目標物體的位置。基於windows的主要工具:

2.1、標註精靈助手

  工具官網:http://www.jinglingbiaozhu.com/

   追蹤效果不佳,框的位置不準確。一直沒想太明白,這個軟件的追蹤算法做的這麼差?

 

2.2、VOTT

  工具官網https://github.com/Microsoft/VoTT/releases

   項目配置的選項較多,全英文,且模型加載有點慢,不利於後期培訓外包人員。

 

2.3、VITBAT

     工具官網:https://vitbat.weebly.com/

     下載鏈接:https://pan.baidu.com/s/1IxaKPyfy9qviXQstaGj0Eg密碼:92sp

      整個軟件基於matlab GUI進行開發,因此需要安裝MATLAB Runtime。操作比較簡單,容易快速上手,官網還有指導手冊。

      首先加載視頻,創建“New target",點擊”Annotate“,然後拖動視頻條,調整對應幀的框的位置,軟件自動將框的位置記錄到模型當中,最後,向前或向後播放視頻,即可瀏覽最終的效果。

以一條抖音視頻爲例的效果:

                                                          

注意:點擊”file“文件下的”Save Annotated video“,文件夾下並未出現追蹤的框的列表文件。需要退出該軟件,在相應的文件夾下才會出現標註結果的文件。

該標註軟件其實不友好,ID不能自定義,採集的幀率也不能配置。後期只能進一步二次加工。

 此外,該軟件還有行爲(握手、擁抱、打鬥,交談。。。)標註功能,在官網中有相應的視頻,如果看不了,建議上B站搜索。

3.參考資料

3.1、https://blog.csdn.net/tju_cc/article/details/82703982

3.2、https://blog.csdn.net/learning_tortosie/article/details/81260862

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章