語音信號處理流程總結

一、語音合成、識別中不可避免

在做語音合成、語音識別過程中,難以避免的會涉及到語音信號知識,通過對多篇博客的閱讀和理解,作以下總結:

二、大致流程
根據 zouxy09博客 ,知道大致預處理流程如下:
在這裏插入圖片描述
接下來再進一步對各個環節進行進一步說明

三、預加重、分幀和加窗

根據 語音加窗分幀處理
在這裏插入圖片描述
四、STFT和聲譜圖,梅爾頻譜(Mel Bank Features)與梅爾倒譜(MFCCs)

根據博客:(https://blog.csdn.net/qq_28006327/article/details/59129110)及 zouxy09博客
在這裏插入圖片描述
更具體的:
在這裏插入圖片描述
在這裏插入圖片描述

在這裏插入圖片描述
在這裏插入圖片描述
各參數:
在這裏插入圖片描述

參考:
https://blog.csdn.net/qq_28006327/article/details/59129110
https://blog.csdn.net/zouxy09/article/details/9156785/
https://blog.csdn.net/jinzhichaoshuiping/article/details/81159333
https://blog.csdn.net/sinat_35821976/article/details/105739909
以及知乎萬贊:https://zhuanlan.zhihu.com/p/19759362

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章