原创 Tensorflow Lite從入門到精通

  TensorFlow Lite 是 TensorFlow 在移動和 IoT 等邊緣設備端的解決方案,提供了 Java、Python 和 C++ API 庫,可以運行在 Android、iOS 和 Raspberry Pi 等設備上。目前

原创 語音和噪聲相關數據集(持續更新)

博客地址:https://www.cnblogs.com/LXP-Never/p/15474948.html(轉載請註明出處) 博客作者:凌逆戰 語音數據集 TIMIT 官方提供的下載地址:https://catalog.ldc.upen

原创 《古詩詞裏的快意人生》讀後感

        《古詩詞裏的快意人生》通過講解詩人的一生讓我瞭解每一首詩的來源背景。一生都在追求極致瀟灑的天才詩人李白;一生遭遇很不幸,卻心懷天下做狂歌的杜甫。爲了功名來到邊塞,從悔恨到漸漸愛上邊塞的岑參。追求“不平則鳴”的韓愈;“世界以

原创 《生死疲勞》讀書有感

先上人物關係圖   讀後感 故事的開頭是主人公西門鬧因爲地主身份被當做典型槍斃了,西門鬧經過7次轉世(驢,牛,豬,狗,猴,大頭兒)親眼見證了後世之事。 轉世爲驢,見證了自己的妻妾們改嫁與生兒,身處合作社的時代,跟着藍臉堅持單幹,但隨之而

原创 神經網絡模型的參數量和計算量

其實模型的參數量好算,但浮點運算數並不好確定,我們一般也就根據參數量直接估計計算量了。但是像卷積之類的運算,它的參數量比較小,但是運算量非常大,它是一種計算密集型的操作。反觀全連接結構,它的參數量非常多,但運算量並沒有顯得那麼大。 FLOP

原创 論文翻譯:2021_LACOPE: Latency-Constrained Pitch Estimation for Speech Enhancement

論文地址:延遲約束的語音增強基音估計 引用格式:Schröter H, Rosenkranz T, Escalante-B A N, et al. LACOPE: Latency-Constrained Pitch Estimation f

原创 論文翻譯:2022_Time-Frequency Attention for Monaural Speech Enhancement

論文地址:單耳語音增強的時頻注意 引用格式:Zhang Q, Song Q, Ni Z, et al. Time-Frequency Attention for Monaural Speech Enhancement[C]//ICASSP

原创 WAVE音頻格式及及轉換代碼 wave文件(*.wav)格式、PCM數據格式 wav文件格式分析與詳解

音頻信號的讀寫、播放及錄音   python已經支持WAV格式的書寫,而實時的聲音輸入輸出需要安裝pyAudio(http://people.csail.mit.edu/hubert/pyaudio)。最後我們還將使用pyMedia(htt

原创 聲學感知刻度(mel scale、Bark scale、ERB)與聲學特徵提取(MFCC、BFCC、GFCC)

梅爾刻度   梅爾刻度(Mel scale)是一種由聽衆判斷不同頻率 音高(pitch)彼此相等的感知刻度,表示人耳對等距音高(pitch)變化的感知。mel 刻度和正常頻率(Hz)之間的參考點是將1 kHz,且高於人耳聽閾值40分貝以上的

原创 語音領域視頻課程及書籍(不定期更新)

國內 【深藍學院】語音信號處理——宋輝,李先剛 【深藍學院】語音識別綜述 【深藍學院】語音識別:從入門到精通——謝磊、孫思寧、張彬彬、呂航、許開拓 【深藍學院】語音合成算法:從HTS到端到端 【深藍學院】語音合成:基礎與前沿——謝磊、陳雲琳

原创 論文翻譯:2020_TinyLSTMs: Efficient Neural Speech Enhancement for Hearing Aids

論文地址:TinyLSTMs:助聽器的高效神經語音增強 音頻地址:https://github.com/Bose/efficient-neural-speech-enhancement 引用格式:Fedorov I,Stamenovic

原创 論文翻譯:2018_LSTM剪枝_Learning intrinsic sparse structures within long short-term memory

論文地址:在長短時記憶中學習內在的稀疏結構 論文代碼:https://github.com/wenwei202/iss-rnns 引用格式:Wen W, He Y, Rajbhandari S, et al. Learning intri

原创 論文翻譯:2021_Performance optimizations on deep noise suppression models

論文地址:深度噪聲抑制模型的性能優化 引用格式:Chee J, Braun S, Gopal V, et al. Performance optimizations on deep noise suppression models[J].

原创 論文翻譯:2021_Towards model compression for deep learning based speech enhancement

論文地址:面向基於深度學習的語音增強模型壓縮 論文代碼:沒開源,鼓勵大家去向作者要呀,作者是中國人,在語音增強領域 深耕多年 引用格式:Tan K, Wang D L. Towards model compression for deep

原创 論文翻譯:2013_Efficient individualization of hearing aid processed sound

論文地址:高效個性化的助聽器處理聲音 引用格式:Nielsen J B, Nielsen J. Efficient individualization of hearing aid processed sound[C]//2013 IEE