語音數據集彙總

1. 噪聲集

  • The QUT-NOISE dataset,來自昆士蘭科技大學(QUT)的噪聲數據集,其中包括了Café,Car,Home,Reverb,Street,五種場景,每種場景下又分了兩個小場景,一共十個場景,約12小時數據,其中reverbe_pool 感覺不常見,訓練時可以考慮刪除。
  • Environmental Background Noise dataset,來自UTDallas的噪聲數據集,包括三個場景,Babble,Car,Machinery,數據約30秒一條,一共253條。
  • MUSAN corpus 來自David Snyder and Guoguo Chen and Daniel Povey,裏面有三個文件夾,分別是music,speech 和 noise。noise分類下有兩個文件夾,數據長短不一,包含了各種生活場景,擴展噪聲集的豐富性,930條。
  • Nonspeech dataset 來自Ohio State University,數據長短不一,包括各種生活場景,擴展噪聲集的豐富性,一共100條。

2. 語音集

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章