英特爾開源計算機視覺數據標籤工具CVAT,加速數據註釋

訓練深度神經網絡需要大量數據。另外,如果數據沒有標籤,那這些數據就沒有多大用處,AI架構也無用武之地,但處理包含數十萬、數百萬對象的語料庫非常耗時。

爲了減輕數據註釋器和數據科學家的負擔,英特爾開源了一個新源程序——計算機視覺註釋工具(CVAT),以加速用來訓練計算機視覺算法的視頻和圖像樣本註釋。

GitHub開源地址奉上,感興趣的同學可以試一試:
https://github.com/opencv/cvat

“爲了加速計算機視覺領域的這一過程,[我們]開發了一個名爲[CVAT]的程序,”英特爾在一篇博文中寫道。 “通常,有很多方法可以註釋數據,但使用特殊工具[如CVAT]可能有助於加快這一過程。”

正如Santa Clara公司所解釋的那樣,CVAT通過Docker進行部署,並通過基於瀏覽器的界面(或者可選地嵌入到Onepanel等平臺中)進行訪問,並具有針對協同工作優化的基於任務的管理系統。(用戶創建公共任務以將工作分開。)它支持與對象檢測、圖像分類和圖像分割相關的監督機器學習任務,以及具有四種類型之一的註釋:框、多邊形、折線和點。

image

使用CVAT註釋汽車和障礙物。

在CVAT中,註釋器可以使用大量工具來複制和傳播對象、應用過濾器、調整視覺設置,以及通過谷歌的TensorFlow框架中的對象檢測API執行自動註釋等。CVAT會自動執行一些檢查(但不是所有檢查,有些檢查需要手動進行),且可與英特爾的OpenVino、英偉達的Cuda和ELK(Elasticsearch、Logstash和Kibana)分析系統等工具包很好地配合使用。

但是,CVAT仍在繼續完善,英特爾表示,目前僅在Chrome上進行了廣泛測試,在其他瀏覽器上可能會不好用,並表示Chrome 中的沙盒功能Sandbox限制了流程周圍的環境,包括使用RAM,這會對工具包的性能產生負面影響。但英特爾承諾將會改進這一點。

“CVAT是在專業註釋和算法團隊的支持下開發的,我們想要爲這些團隊提供最有價值的功能…用戶的反饋有助於英特爾確定CVAT未來的發展方向,”該公司表示。“我們希望改進工具的用戶體驗、功能集、穩定性、自動化功能以及與其他服務集成的能力,並鼓勵社區成員積極參與CVAT的開發。”

在CVAT發佈幾周前,Uber開源了自動可視化系統(一個基於網絡的車輛數據平臺),之後,Scale和Hive等樣本標籤初創公司也籌集了大量的風險投資,並吸引了優步和通用汽車等大廠的關注。

參考鏈接:https://venturebeat.com/2019/03/05/intel-open-sources-cvat-a-toolkit-for-data-labeling/

image

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章