語音數據標註工具與平臺/公司

最近在做語音深度學習的項目,整理了一下語音數據標註工具和語音標註平臺,供大家參考

語音標註工具--Praat

Praat是目前已經成爲比較流行也比較專業的語音處理的軟件,可以進行語音數據標註、語音錄製、語音合成、語音分析等等,具有免費、佔用空間小、通用性強、可移植性好等特點
官網鏈接 http://www.fon.hum.uva.nl/praat/
漢化版下載 http://www.hejingzong.cn/blog/ViewBlog_54.aspx#vidio

  1. 打開音頻文件,點擊標註(Annotate),轉換爲 TextGrid文件
    Praat語音標註工具打開
  2. 分“層”,這裏分爲文本、性別、身份、噪音 四層
    Praat語音標註工具分層
  3. 按住Ctrl,將音頻文件和TextGrid文件都選上,點擊 查看&編輯(View & Edit),開始進行標註
    Praat語音標註編輯
  4. 完成標註,保存
    Praat語音標註編輯

總的來說,Praat功能強大,但是用作語音標註,操作並不簡便,難以對大批量的語音數據做好管理。最近我們找到幾家數據標註平臺,各家自研的標註工具更加簡單好用。

語音數據標註平臺/公司

京東衆智
京東衆智的工具是單獨開發的(這個也挺好開發和複用的)操作方面簡單很多,標註人員全部是在線上作答,也避免了數據外泄問題。值得一提的是,因爲我們的初始數據是用算法跑過一遍的,雖然準確率不是很高...京東衆智可以把我們的標註結果展示出來,標註人員簡單修改一下,效率就提高很多。經過協商,因爲不用重新標註,報價也減少了一些。
京東衆智語音標註平臺

今天先介紹這兩個...未完待續=3=

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章