英特爾開源計算機視覺數據標籤工具CVAT，加速數據註釋

原創

英特尔官博

2019-03-06 11:48

訓練深度神經網絡需要大量數據。另外，如果數據沒有標籤，那這些數據就沒有多大用處，AI架構也無用武之地，但處理包含數十萬、數百萬對象的語料庫非常耗時。

爲了減輕數據註釋器和數據科學家的負擔，英特爾開源了一個新源程序——計算機視覺註釋工具（CVAT），以加速用來訓練計算機視覺算法的視頻和圖像樣本註釋。

GitHub開源地址奉上，感興趣的同學可以試一試：
https://github.com/opencv/cvat

“爲了加速計算機視覺領域的這一過程，[我們]開發了一個名爲[CVAT]的程序，”英特爾在一篇博文中寫道。 “通常，有很多方法可以註釋數據，但使用特殊工具[如CVAT]可能有助於加快這一過程。”

正如Santa Clara公司所解釋的那樣，CVAT通過Docker進行部署，並通過基於瀏覽器的界面（或者可選地嵌入到Onepanel等平臺中）進行訪問，並具有針對協同工作優化的基於任務的管理系統。（用戶創建公共任務以將工作分開。）它支持與對象檢測、圖像分類和圖像分割相關的監督機器學習任務，以及具有四種類型之一的註釋：框、多邊形、折線和點。

使用CVAT註釋汽車和障礙物。

在CVAT中，註釋器可以使用大量工具來複制和傳播對象、應用過濾器、調整視覺設置，以及通過谷歌的TensorFlow框架中的對象檢測API執行自動註釋等。CVAT會自動執行一些檢查（但不是所有檢查，有些檢查需要手動進行），且可與英特爾的OpenVino、英偉達的Cuda和ELK（Elasticsearch、Logstash和Kibana）分析系統等工具包很好地配合使用。

但是，CVAT仍在繼續完善，英特爾表示，目前僅在Chrome上進行了廣泛測試，在其他瀏覽器上可能會不好用，並表示Chrome 中的沙盒功能Sandbox限制了流程周圍的環境，包括使用RAM，這會對工具包的性能產生負面影響。但英特爾承諾將會改進這一點。

“CVAT是在專業註釋和算法團隊的支持下開發的，我們想要爲這些團隊提供最有價值的功能…用戶的反饋有助於英特爾確定CVAT未來的發展方向，”該公司表示。“我們希望改進工具的用戶體驗、功能集、穩定性、自動化功能以及與其他服務集成的能力，並鼓勵社區成員積極參與CVAT的開發。”

在CVAT發佈幾周前，Uber開源了自動可視化系統（一個基於網絡的車輛數據平臺），之後，Scale和Hive等樣本標籤初創公司也籌集了大量的風險投資，並吸引了優步和通用汽車等大廠的關注。

參考鏈接：https://venturebeat.com/2019/03/05/intel-open-sources-cvat-a-toolkit-for-data-labeling/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

英特爾開源計算機視覺數據標籤工具CVAT，加速數據註釋

前端使用 Konva 實現可視化設計器（13）- 折線 - 最優路徑應用【思路篇】

英特爾開源計算機視覺數據標籤工具CVAT，加速數據註釋

英特爾開源分佈式深度學習平臺Nauta，使用Kubernetes 和 Docker 平臺運行

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結