這幾天都在給實驗室的老師普及語音識別的知識,可我自己也是個二把刀啊!
被迫寫了個流程圖和學習計劃,感覺做不到頭我就已經畢業了,總之加油吧。
1、瞭解語音識別流程和各部分的作用;
目的:能清楚的搭建框圖,並對各部分常用方法和意義有簡單認識。
2、瞭解kaldi工具箱每個模塊的作用;
目的:將每個腳本和C++程序與框圖中的流程對應起來。
3、瞭解每個模塊中算法或模型的意義和優勢;
目的:每個模塊掌握至少一種常用算法的數學基礎並讀懂C++程序。MFCC\LDA\GMM\HMM
4、按照流程圖分模塊搭建一個經典的語音識別系統;
目的:掌握基本的腳本語言編程,利用kaldi搭建。
5、驗證系統每個模塊的正確性;
目的:比對相應模塊各種算法的有效性,並總結。
6、更改算法或聲學模型,提高識別正確率和系統魯棒性。
需要掌握的基礎知識:
隨機過程、矩陣論、Linux系統、shell、C++、編解碼原理等。