音頻編碼基礎


語音和視頻是模擬的,但數據通信網絡是數字的。爲了方便傳輸需要把模擬信號數字化(Analog to Digital Converter, ADC)。ADC需要經過三個過程:採樣, 量化, 編碼。


1 採樣


採樣就是在一個時間上連續的模擬信號上取出若干個有代表性的樣本值。假設一個在時間和幅值上都連續的模擬音頻信號的函數表示爲m(t),採樣的過程就是在時間上將函數x(t)離散化的過程。一般的採樣是按均 勻的時間間隔進行的。設這一時間間隔爲T,則取樣後的信號爲m(nT),n爲自然數。
具體的過程可以表示爲:


 

採樣定理(香農定理):

如果信號是帶限的,並且採樣頻率大於信號帶寬的2倍,那麼,原來的連續信號可以從採樣樣本中完全重建出來。
語音信號的頻帶爲300~3400Hz,則若抽樣頻率fs≥2×3400=6800Hz,那麼抽樣後的樣值序列可不失真地還原成原來的話音信號。實際上,語音音信號的抽樣頻率通常取8000Hz/s。


數字音頻領域,常用的採樣率有:


2 量化

經過採樣後,時間離散的信號在幅度上仍然是連續的,它仍屬模擬信號。當這種抽樣後的信號經過一個有噪聲干擾的信道時,信道中的噪聲會疊加在抽樣值上面,使得接收端不可能精確地判別抽樣值的大小。


爲了消除這種噪聲的累積,可以在發送端用有限個預先規定好的電平來表示抽樣值,再把這些有限個預先規定的電平編爲二進制代碼組,然後通過信道傳輸。這樣就可以把信道的噪聲影響徹底消除了。


用有限個電平來表示模擬信號抽樣值被稱爲量化。抽樣是把時間連續的模擬信號變成了時間上離散的模擬信號,量化則進一步把時間上離散但幅度上仍然連續的信號變成了時間上和幅度上都離散了的信號,顯然這種信號就是數字信號了。


量化的過程可以通過上圖加以說明。其中m(t)是模擬信號, 抽樣頻率爲$f_s=1/T_s$, 第k個抽樣值爲$m(kT_s)$, $x_q(t)$表示量化信號,$m_1$到$m_M$是預先規定好的M個量化電平。$x_i$爲第i個量化區間的終點電平(分層電平), 電平之間的間隔$x_i - x_{i-1}$爲量化間隔。


3 編碼


模擬信號經過抽樣和量化以後,可以得到一系列輸出,它們共有Q個電平狀態。當Q比較大時,如果直接傳輸Q進制的信號,其抗噪聲性能將會是很差的,因此,通常在發射端通過編碼器把Q進制信號變換爲k位二進制數字信號。而在接收端將收到的二進制碼元經過譯碼器再還原爲Q進制信號,這種系統就是脈衝編碼調製(PCM)系統。簡而言之,把量化後的信號變換成代碼的過程稱爲編碼,其相反的過程稱爲譯碼。

常用的二進制編碼碼型
    二進制碼具有很好的抗噪聲性能,並易於再生,因此PCM中一般採用二進制碼。對於Q個量化電平,可以用k位二進制碼來表示,稱其中每一種組合爲一個碼字。通常可以把量化後的所有量化級,按其量化電平的某種次序排列起來,並列出各對應的碼字,而這種對應關係的整體就稱爲碼型。在PCM中常用的碼型有自然二進制碼、摺疊二進制碼和反射二進制碼(又稱格雷碼)等。


參考文獻:

1, 採樣率

2, 脈衝編碼調製

3, G.711 codec process

4, 通信原理


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章