寬帶語音編碼器

引言

隨着 IP 電話的廣泛應用以及 3G 無線手持終端即將大量投產,通過"新型"分組電話網絡提供優於普通長話音質的音頻性能面臨巨大機遇。我們可利用數據網絡不受目前電話網絡 8 KHZ 採樣率(4 KHZ 通頻帶)限制的功能來實現優於普通長話音質的語音。我們提供低價的 DSP 進行寬帶信號壓縮,便於其在分組網絡上傳輸,這也是目前上述功能成爲現實的原因之一。

本文所討論的課題就是寬帶語音編碼器及其實施所面臨的挑戰。我們將探討標準化的寬帶語音編碼器,並討論當前技術狀態以及發展方向。此外,我們還將討論系統影響以及廣泛採用所面臨的一些障礙。

寬帶語音編碼器

目前 IP 語音 (VoIP) 系統使用的大多數語音編碼器都經過調整,可通過傳統 PSTN 的帶寬,因爲與傳統 PSTN 的互操作性一直是一個關鍵要求。由於 PSTN 使用 8 KHZ 的採樣率,該帶寬限制在大約 200-3400 HZ。寬帶語音編碼器將可用通頻帶擴展到 50-7000 HZ,針對的是不直接與傳統數字 PSTN 進行互操作的應用。這就大大改善了語音交談的音質,讓我們能更清楚地聽到通話,並更好地識別講話者。此外,傳輸更高質量的音頻信號(如音樂)也由此成爲可能。

標準組織多年來一直在努力爲上述應用定義寬帶語音編碼器標準。早期寬帶編碼器的主要用途是電視會議,不過近期工作則集中在 VoIP 與無線應用上。

以下部分將介紹寬帶語音編碼器的各種不同標準。

寬帶語音編碼--機遇與實施挑戰

G.722 (SB-ADPCM)

ITU G.722 於 1988 年標準化,是第一個用於 16 KHZ 採樣率的標準化寬帶語音編碼算法。該編解碼器將 16 KHZ 的頻帶分爲兩個子頻帶,並用 ADPCM 算法在子頻帶中進行編碼。其總延遲約 3 ms,這已經很小,不致造成電信網絡中的回聲問題。此外,該編解碼器傳輸位誤差率僅爲 10-3,其性能可以接受。即使遇到最差的網絡傳輸條件,上述要求也可確保性能只是稍稍下降。

G.722 編解碼器在 16 kHz 頻率上接收 16 位數據(帶寬從 50 Hz 至 7 kHz),並將其壓縮爲 64、56 與 48 Kbit/s。

G.722.1(轉換 (Transform) 編碼器)

ITU G.722.1 於 20 世紀 90 年代末開發,可實現比 G.722 編解碼器更低的比特率以及更大的壓縮。目標是以大約一半的比特率實現與 G.722 大致相當的質量。該編解碼器由 Picturetel 開發,使用了轉換編碼的方法。其在 16 KHZ 頻率上接收 16 位數據(帶寬從 50 Hz 至 7 kHz),並將其壓縮爲 32 與 24 Kbits/s。目前大多用於電視會議系統。

G.722.2 (AMR-WB)

AMR-WB 是一種最初爲 GSM 無線網絡定義的寬帶編解碼器,但最近擴展爲包括有線系統。由於其計算強度很大,因此要充分利用多年來顯著提高的 DSP 處理能力。AMR-WB 建立在 CELP 語音編碼器基礎上,音頻帶寬爲 50-7000 HZ,在 6.6 至 23.85 Kbit/s 間提供 9 種語音編碼。

AMR-WB 於 2001 年標準化,用於 GSM 與 WCDMA 網絡。2002 年底,ITU 決定它還將作爲有線應用的寬帶標準。它是第一個具有雙重應用範圍的編解碼器。

寬帶語音編碼--機遇與實施挑戰

VMR-WB

VMR-WB 是新型可變速率多模式寬帶語音編解碼器,專爲無線 CDMA 2000標準而設計,目的在於在 50 至 7000 HZ 的頻帶上進行語音編碼,採樣率爲 16 KHZ。VMR-WB 基於 3GPP AMR-WB (G722.2) 編解碼器,在每秒速率12.65 Kbit 上可實現互操作。

VMR-WB 工作模式有四種,具體選擇哪種應視網絡的流量情況而定。前三種模式專門針對 CDMA 系統,而第四種模式爲 AMR-WB 互操作性模式。

VMR-WB 與 AMR-WB 的互操作性允許 GSM/WCDMA 與 CDMA2000 系統無須進行自動解碼即可通信,這就不至於增加額外的延遲以及引起語音質量下降。

實施寬帶編解碼器的系統影響

電話系統設計有兩個主要領域會因使用寬帶編解碼器而受影響:1) 模數輸入/輸出子系統,2) DSP 中進行的軟件處理。

以下給出了 IP 電話的樣例結構圖,並在該圖右下方顯示了 DSP 處理器與A/D I/O 子系統之間的關係。

寬帶語音編碼--機遇與實施挑戰

模數輸入/輸出子系統

A/D I/O 子系統包括揚聲器、麥克風與硬件編解碼器,對音頻信號進行採樣並將其數字化,以傳輸至 DSP。在能夠進行寬帶語音編碼的電話中,重要的是讓上述所有組件都支持 50-7000 Hz 的頻帶,這是寬帶語音編碼器的要求。

這意味着通常用於標準 PSTN 功能電話中的揚聲器與麥克風將不再適用,從面將限制基於其設計的帶寬。我們必須用具有寬帶功能的揚聲器與麥克風來替代它們。

此外,用於傳統 PSTN 應用的標準硬件編解碼器中的濾波器會帶有防混淆濾波器,它將帶寬限制在 200-3400 Hz。因此,設計具有寬帶功能電話時的另一重要考慮因素就是使用支持 50-7000 Hz 帶寬的硬件編解碼器,並能以 16 Khz 進行信號採樣。

軟件

關於具有寬帶功能電話軟件的主要考慮因素之一是,要求串行輸入端口與寬帶語音編碼器之間的處理組件必須運行於 16 KHz。該要求使單位時間必須處理的數據量翻番,通常也造成處理需求翻番。下頁的結構圖顯示了從左側 PCM 接口單元開始的受影響的組件。對處理要求影響最大的模塊是回聲抵消器,它的運行速率必須爲傳統 IP 電話的兩倍,這影響相當大,因爲回聲抵消器佔用大量的計算資源。

第二大受影響領域就是寬帶語音編碼器本身需要的處理要求。下頁的表顯示了AMR-WB 編解碼器的處理要求相對於原先基於的 G.722 ADPCM 編碼器增加了多少。AMR-WB 的 25 MIPS 要求相對於 12 MIPS 範圍內的窄帶 AMR 編解碼器而言也是一個巨大的飛越。

 

語音處理--DSP 軟件

Telogy Software®TMS320C55x™編解碼器(寬帶)模塊

編解碼器模塊 接口 C55xMIPS 程序存儲器 C55x 存儲器分配 臨時 (Scratch)
表 數據 Mem/ch
G.722 Xdias 5.61 1726 340 164 438
G.722.1 Xdias
AMR-WB Xdias 25.85 22436 13073 2537 4435

總結

本文介紹了在 VoIP 系統中實施寬帶語音編解碼器所面臨的機遇與挑戰。更強大的 DSP 可滿足新型聲音輸入/輸出設備的要求以及處理要求,這使用戶能夠通過寬帶音頻編碼改善音質

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章