我對聲紋識別的認識|簡記

通常的聲紋識別研究相關模型包含:預處理、特徵提取、建模選擇和評分決策。整個過程分爲兩大步驟,訓練和識別。訓練是通過對說話人註冊來提取語音特徵進而建立說話人聲紋模版庫,測試識別是將待測試語音的模版參數與聲紋庫中的聲紋模版進行比對識別。

  • 數據準備(數據集的選取、音頻信噪比、截幅檢測)
  • 預處理(預加重、分幀加窗和語音端點檢測)
  • 特徵提取(語譜圖、MFCC)
  • 建模選擇(模型和損失函數)
  • 評分決策(PLDA、cos)

持續補充中…


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章