最近在做語音深度學習的項目,整理了一下語音數據標註工具和語音標註平臺,供大家參考
語音標註工具--Praat
Praat是目前已經成爲比較流行也比較專業的語音處理的軟件,可以進行語音數據標註、語音錄製、語音合成、語音分析等等,具有免費、佔用空間小、通用性強、可移植性好等特點
官網鏈接 http://www.fon.hum.uva.nl/praat/
漢化版下載 http://www.hejingzong.cn/blog/ViewBlog_54.aspx#vidio
- 打開音頻文件,點擊標註(Annotate),轉換爲 TextGrid文件
- 分“層”,這裏分爲文本、性別、身份、噪音 四層
- 按住Ctrl,將音頻文件和TextGrid文件都選上,點擊 查看&編輯(View & Edit),開始進行標註
- 完成標註,保存
總的來說,Praat功能強大,但是用作語音標註,操作並不簡便,難以對大批量的語音數據做好管理。最近我們找到幾家數據標註平臺,各家自研的標註工具更加簡單好用。
語音數據標註平臺/公司
京東衆智
京東衆智的工具是單獨開發的(這個也挺好開發和複用的)操作方面簡單很多,標註人員全部是在線上作答,也避免了數據外泄問題。值得一提的是,因爲我們的初始數據是用算法跑過一遍的,雖然準確率不是很高...京東衆智可以把我們的標註結果展示出來,標註人員簡單修改一下,效率就提高很多。經過協商,因爲不用重新標註,報價也減少了一些。
今天先介紹這兩個...未完待續=3=