一、語音合成、識別中不可避免
在做語音合成、語音識別過程中,難以避免的會涉及到語音信號知識,通過對多篇博客的閱讀和理解,作以下總結:
二、大致流程
根據 zouxy09博客 ,知道大致預處理流程如下:
接下來再進一步對各個環節進行進一步說明
三、預加重、分幀和加窗
根據 語音加窗分幀處理
四、STFT和聲譜圖,梅爾頻譜(Mel Bank Features)與梅爾倒譜(MFCCs)
根據博客:(https://blog.csdn.net/qq_28006327/article/details/59129110)及 zouxy09博客
更具體的:
各參數:
參考:
https://blog.csdn.net/qq_28006327/article/details/59129110
https://blog.csdn.net/zouxy09/article/details/9156785/
https://blog.csdn.net/jinzhichaoshuiping/article/details/81159333
https://blog.csdn.net/sinat_35821976/article/details/105739909
以及知乎萬贊:https://zhuanlan.zhihu.com/p/19759362