深度學習基礎（一）：windows下視頻數據半自動化標註工具

原創

2020-06-25 06:49

目錄

1.數據認知

原本認爲這一塊應當會有很多比較成熟的開源軟件，但是實際情況好像並非想象這樣，單純基於圖像的標註工具較多，但是視頻類相對較少。

看到很多簡單場景下的視頻數據標註，仍然採用傳統的全人工標註，效率低下數據標註不僅造成資金浪費，更會拖沓開發進度。半自動化標註在很多場景下效率至少是人工的效率的10倍以上，我們爲何不嘗試呢？算法人員應當投入更多精力到數據採集、數據標註和數據清洗過程中去，深入瞭解生產環境和應用場景，相信這會對業務大有裨益。

就一般的識別和檢測的場景數據，現階段數據獲取的手段主要有：1、部署硬件採集設備，主要爲彩色相機和深度相機 2、實驗室模擬真實環境，進行高仿真採集3、網上爬蟲爬取相關數據，然後進行數據清洗 4、將目標元素和背景合成，僞造數據。5、使用數據增強技術，擴充數據集。無論如何我們應當收集並構建一個無限接近實際場景的數據集，個人認爲：數據集的構建是算法業務的起跑線，數據是資產，是分水嶺，是門檻。技術以服務產品爲使命，而非追求酷炫和繁雜，而技術又應當從整個開發全流程的每一個模塊，每一個細節去優化與權衡，雖然抵達烏托邦的路途遙遠艱辛，但是心嚮往之。

2.標註工具

考慮到很多外包數據標註人員的實際情況，主要調研了基於windows下半自動化視頻數據標註工具。半自動化標註工具現階段主要採用基於追蹤算法和檢測算法自動標註出目標物體的位置。基於windows的主要工具：

2.1、標註精靈助手

工具官網：http://www.jinglingbiaozhu.com/

追蹤效果不佳，框的位置不準確。一直沒想太明白，這個軟件的追蹤算法做的這麼差？

2.2、VOTT

工具官網：https://github.com/Microsoft/VoTT/releases

項目配置的選項較多，全英文，且模型加載有點慢，不利於後期培訓外包人員。

2.3、VITBAT

工具官網：https://vitbat.weebly.com/

下載鏈接:https://pan.baidu.com/s/1IxaKPyfy9qviXQstaGj0Eg密碼：92sp

整個軟件基於matlab GUI進行開發，因此需要安裝MATLAB Runtime。操作比較簡單，容易快速上手，官網還有指導手冊。

首先加載視頻，創建“New target",點擊”Annotate“，然後拖動視頻條，調整對應幀的框的位置，軟件自動將框的位置記錄到模型當中，最後，向前或向後播放視頻，即可瀏覽最終的效果。

以一條抖音視頻爲例的效果：

注意：點擊”file“文件下的”Save Annotated video“，文件夾下並未出現追蹤的框的列表文件。需要退出該軟件，在相應的文件夾下才會出現標註結果的文件。

該標註軟件其實不友好，ID不能自定義，採集的幀率也不能配置。後期只能進一步二次加工。

此外，該軟件還有行爲（握手、擁抱、打鬥，交談。。。）標註功能，在官網中有相應的視頻，如果看不了，建議上B站搜索。

3.參考資料

3.1、https://blog.csdn.net/tju_cc/article/details/82703982

3.2、https://blog.csdn.net/learning_tortosie/article/details/81260862

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

5月21日，文心中國行將走進上海，在張江科學會堂舉行。屆時，政府、企業與高校的相關專家和業界同仁將現場分享生成式人工智能與大模型最新進展，主要圍繞大模型技術如何賦能產業級應用創新展開探討，還有百度風投從投資視角帶來的觀點，讓參會者全方位瞭解

2024-05-17 00:28:21

白鯨開源CEO郭煒在2024 DataOps發展大會上獲聘專家

2024年5月15日，白鯨開源CEO郭煒在2024 DataOps發展大會上被正式聘任爲DataOps專家，並獲得了榮譽證書。本次大會由中國通信標準化協會主辦，中關村科學城管委會提供支持，大數據技術標準推進委員會（CCSATC601）承辦，

2024-05-16 11:28:50

共創數字經濟新生態，華爲雲生態領航者·AI先遣隊圓滿落幕

5月9-11日，華爲雲生態“領航者·AI先遣隊”課程班在杭州成功舉辦，本次課程聚焦於AI前沿探索與實踐的高端研修，匯聚了來自華爲雲生態夥伴企業的高層決策者，共同開啓了一場關於智慧升級與生態共建的深度對話。華爲雲生態領航者·AI先

2024-05-16 10:58:48

2024數據標註公司20強排行榜（附榜單）

近日，德本諮詢發佈“2024數據標註公司排行”。數據標註行業作爲人工智能領域的重要組成部分，其需求正在不斷增長。近年來，數據標註行業發展迅速，規模實現了顯著增長。以2023年爲例，該行業的規模已經達到了60.8億元，同比增長了約19.69

2024-05-16 02:09:44

Kimi大模型，加入微信了

哈哈哈，喜大普奔！前段時間發現微信公衆號被開通留言，最近又發現 Kimi大模型現在可以接入微信公衆號了！這意味着我們能夠更加便捷地享受到Kimi智能助手的服務，還代表着我們有了一個免費且好用且穩定且無需翻牆的 AI助

2024-05-13 23:51:55

內嵌專業接口的RISC-V架構MCU，誰家有？

前一陣，蘋果推出了M1處理器，相比關注具體指標，業內其實更關心M1推出後會引領產業往哪個方向發展，不少人的結論是RISC-V會成爲未來芯片發展的熱點，因爲RISC-V有很多巧妙的方法可以提高性能。計算機界泰斗David Patterso

2024-05-13 23:26:39

免費報名|Zabbix受邀出席上海開源技術沙龍，探討開源軟件賦能新質生產力

大家好！5月25日我們將舉辦今年第三期上海開源技術沙龍活動。本次的主題是——開源軟件賦能新質生產力。在上海開源信息技術協會 (SHOpen) 的指導下，隨着活動的持續開展，上海開源技術沙龍獲得了越來越多開發者的關注與

2024-05-13 22:34:43

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

舌尖上的AI：人工智能技術正在被“端上”餐桌

來源 | 人民數字FINTECH 責編 | 晉兆雨頭圖 | CSDN 下載自視覺中國 #人工智能技術正在被“端上”餐桌四方食事，不過一碗人間煙火。人工智能作爲一門新的技術科學，正在被人間煙火氣“端”上餐桌。人工智能“洗手”

2024-05-13 21:17:25

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

LoRA微調語言大模型的實用技巧與實踐

隨着人工智能技術的不斷髮展，大型語言模型在各個領域的應用越來越廣泛。然而，大型語言模型的訓練成本高昂，且難以適應不同領域的具體需求。爲了解決這個問題，LoRA微調技術應運而生。本文將介紹LoRA微調語言大模型的實用技巧，幫助讀者更好地應用這

2024-05-09 12:48:45

海外市場成 ISV 新掘金地？生成式 AI 如何加速業務創新實踐？Zilliz 有話說

期望瞭解 Zilliz 最新動態？想要與 Zilliz 線下探討 AI 時代向量數據庫的全球化佈局思考及典型實踐？機會來啦！5 月 10 日，Zilliz 將閃現亞馬遜雲科技的兩場活動現場（蘇州、西安），與大家共話行業發展與未來，歡迎報名

2024-05-08 21:21:54

程序員不存在了……嗎？

近期，在談及人工智能的發展速度時，馬斯克預計，按照當前的技術進步速度，到2030年人工智能的智力可能超越人類，這項技術甚至有可能終結人類。那麼，人工智能的強大究竟對人類將帶來更多機遇還是危機呢？今天，我們特邀了《深入理解 FFmpeg

2024-05-08 11:12:06

AI繪圖新選擇：Fooocus工具發佈，小顯存助力大模型運行

隨着人工智能技術的飛速發展，AI繪圖工具已經成爲了衆多創作者們的得力助手。它們能夠基於深度學習算法，快速生成高質量的圖像，爲設計、藝術等領域注入了新的活力。然而，傳統的AI繪圖工具往往對硬件要求較高，使得許多擁有較低配置設備的用戶望而卻步。

2024-05-07 23:30:10

京東科技數字化營銷能力的演進與最佳實踐| 京東雲技術團隊

1.導讀在當今數字化時代，全球互聯網用戶已超過50億人，中國的互聯網用戶數量更是達到10.5億，這爲企業提供了巨大的市場機遇和挑戰。根據市場研究公司的最新報告，全球數字營銷費用支出預計將在未來五年內進一步大幅增加，這表明數字化營銷已成爲

2024-05-07 23:17:11

24小時熱門文章

最新文章

最新評論文章