原创 語音信號處理中的“窗函數”

文章代碼倉庫:https://github.com/LXP-Never/window_fun 窗函數貫穿整個語音信號處理,語音信號是一個非平穩的時變信號,但“**短時間內可以認爲語音信號是平穩時不變的,一般 10~30ms**。 對連續

原创 如何快速瞭解一個行業

那麼作爲門外漢,如何快速瞭解一個行業。可以從四個層面系統性地去了解 1、行業瞭解的目的 一般來說,從企業角度出發做行業分析的目的通常有三個: 瞭解所屬行業的發展現狀、競爭優劣、行業前景等,現在這個行業裏競爭環境如何。 挖掘行業機會點,明

原创 論文閱讀:2023_Semantic Hearing: Programming Acoustic Scenes with Binaural Hearables

論文地址:語義聽覺:用雙耳可聽器編程聲學場景 論文代碼:https://semantichearing.cs.washington.edu/ 引用格式:Veluri B, Itani M, Chan J, et al. Semantic H

原创 Linux後臺跑程序的方法總結

當使用ssh進行遠程代碼運行時,控制端電腦通常不能出現任何意外。然而,運行深度學習程序通常需要數小時或數天的時間,這意味着我們的IDE不能關閉。一旦出現非人爲因素(如斷電、斷網或IDE卡死關閉),遠程程序也會中斷。因此,將程序靈活地運行在服

原创 EQ 均衡器

EQ 的全稱是 Equalizer,EQ 是 Equalizer 的前兩個字母,中文名字叫做“均衡器”。最早是用來提升電話信號在長距離的傳輸中損失的高頻,由此得到一個各頻帶相對平衡的結果,它讓各個頻帶的聲音得到了均衡。 EQ 的主要功能是:

原创 芯片算法性能度量單位

芯片算法常用性能度量單位有: TOPS(Tera Operation Per Second)每秒一萬億次運算 DMIPS(Dhrystone Million Instructions Per Second)每秒一百萬個指令 MIPS(Mi

原创 論文翻譯:2021_Real-Time Denoising and Dereverberation wtih Tiny Recurrent U-Net

論文地址:微型循環U-Net實時降噪和去混響 論文代碼: https://github.com/YangangCao/TRUNet https://github.com/amirpashamobinitehrani/tinyrecurr

原创 如何跟蹤語音領域的技術

語音頂會 ICASSP 所有年份論文集下載地址:https://ieeexplore.ieee.org/xpl/conhome/1000002/all-proceedings Interspeech 所有年份論文集下載地址:https://

原创 論文翻譯:2023_THLNet: two-stage heterogeneous lightweight network for monaural speech enhancement

論文地址:THLNet: 用於單耳語音增強的兩級異構輕量級網絡 代碼:https://github.com/dangf15/THLNet 引用格式:Dang F, Hu Q, Zhang P. THLNet: two-stage heter

原创 論文翻譯:2022_Phase-Aware Deep Speech Enhancement: It's All About The Frame Length

論文地址:相位感知深度語音增強:這完全取決於幀長 引用格式:Peer T, Gerkmann T. Phase-aware deep speech enhancement: It's all about the frame length[J

原创 論文翻譯:2022_Time-Shift Modeling-Based Hear-Through System for In-Ear Headphones

論文地址:基於時移建模的入耳式耳機透聽系統 引用格式: 摘要   透傳(hear-through,HT)技術是通過增強耳機佩戴者對環境聲音的感知來主動補償被動隔離的。耳機中的材料會減少聲音 500Hz以上的高頻成分。HT算法利用麥克風和

原创 論文翻譯:2022_PercepNet+: A Phase and SNR Aware PercepNet for Real-Time Speech Enhancement

博客地址:凌逆戰 (轉載請註明出處)  論文地址:PercepNet+: 用於實時語音增強的相位和信噪比感知 PercepNet 引用格式: Ge X, Han J, Long Y, et al. PercepNet+: A Phase

原创 論文翻譯:2022_2022_TEA-PSE 2.0:Sub-Band Network For Real-Time Personalized Speech Enhancement

論文地址:TEA-PSE 2.0:用於實時個性化語音增強的子帶網絡 論文代碼: 引用: 摘要   個性化語音增強(Personalized speech enhancement,PSE)利用額外的線索,如說話人embeddings來去除

原创 動態範圍控制原理

DRC介紹   開門見山,動態範圍的定義就是信號的最大幅值和最小幅值比值的對數(單位dB),   動態範圍會受到系統中各個環節的影響。例如同樣是這段音樂,在一個40dB背景噪聲的環境中播放,那麼由於掩蔽效應等因素的影響,最終實際聽到的音樂

原创 Pytorch模型量化

在深度學習中,量化指的是使用更少的bit來存儲原本以浮點數存儲的tensor,以及使用更少的bit來完成原本以浮點數完成的計算。這麼做的好處主要有如下幾點: 更少的模型體積,接近4倍的減少; 可以更快的計算,由於更少的內存訪問和更快的in