3gpp 中的AAC和AMR

http://www.compotech.com.cn/articleinfo.php?id=4678

3G移動語音編碼標準介紹
 
 
 
作者:謙君
 
在MP3之後,3GPP又制定了一系列的語音編碼(壓縮)新標準──AAC和AMR家族。AAC家族包含了AAC、HE-AAC、EAAC+;其競爭對手AMR家族則包含了:AMR、AMR-WB、AMR-WB+。這些新技術足夠讓人眼花繚亂,但對手機芯片、製造業者和工程師而言,這是一個嶄新的機會。
  
AAC

AAC(Advanced Audio Coding)也稱爲MPEG-2 AAC,是一種數據會遺失(lossy)的語音串流壓縮標準。AAC是MPEG-2的一部份,是用來取代MP3的,但是AAC和MP3不同,AAC無法向後兼容,MP3可以,例如:MP3可以和MP2兼容。

AAC最多可以支持48個頻道,取樣率從8 kHz到96 kHz。AAC的語音分辨率(resolution)比MP3高,一般而言,96 kbps的AAC之語音品質優於或等同於128 kbps的MP3,因此,AAC可以在低速的網絡內傳輸語音串流,而且,不會影響語音的品質。
  
HE-AAC(AAC+)

HE(high efficiency) AAC又稱爲MPEG-4 HE-AAC或簡稱AAC+,它是MPEG-2 AAC和SBR(Spectral Band Replication)帶寬延伸修訂版的技術組合。HE-AAC不是要取代AAC,而是要延伸MPEG-4的語音品質,能夠以更低的速率傳輸(32 kbps)。而且,HE-AAC譯碼器可以對AAC解碼。

若要產生48 kbps的HE-AAC立體聲,HE-AAC編碼器會產生兩種信號:一個是42 kbps的MPEG AAC信號,另一個是6 kbps的SBR信號。然後,此SBR信號置於MPEG AAC的輔助字段內(該字段是MPEG-4定義的)。最後,構成一個完整48 kbps的MPEG-4 HE-AAC串流。SBR代表高頻的成份,而AAC代表低頻的成份。HE-AAC譯碼器使用AAC和SBR信號,產生全頻信號;而AAC譯碼器只使用AAC信號,亦即,只有低頻成份被它解碼。

HE-AAC能傳輸48 kbps的CD立體聲,或128 kbps、5.1聲道的“環場聲”(surround sound)。這樣的效率,使它適用於Internet傳輸,或移動數字廣播。不過,由於HE-AAC的高延遲特性,使它不適用於雙向的通信應用。
  
EAAC+

Enhanced AAC+(EAAC+)是在2004年時,納入3GPP的第6版標準中。根據3GPP,它是由MPEG-4 AAC、MPEG-4 SBR和MPEG-4“參數立體聲”(Parametric Stereo)技術組合的。“參數立體聲”技術能夠在低傳輸率中,進行“立體聲”的編碼,其基本原理類似SBR。
  
AMR

AMR(Adaptive Multi-Rate)標準是在1998年被提出。它的主要功能是提供移動裝置使用的基本語音(baseline speech)。它以可變速率的非立體聲(mono)傳輸,速率在4.75 kbps~12.2 kbps之間,它屬於窄頻,帶寬只有3.5 kHz。它被3GPP當成3G無線電網絡系統的基本編譯碼技術;3G是從GSM、WCDMA、EDGE、GPRS演變而來的,而且,不管是2G、2.5G或3G,AMR都是這些無線電網絡標準的最基本編譯碼技術。

AMR的基本原理是:當通信干擾增加時,就降低編譯碼速率,而且還能實現更多的校錯(error correction)功能。AMR也可以讓不同手機系統的編譯碼技術之間能夠儘量兼容,這是靠ACELP(Algebraic Code Excited Linear Prediction)技術達到的。ACELP是一種語音壓縮系統,它可以在低速的網絡環境中,提供高品質的語音。
  
AMR-WB

AMR-WB(wideband extension)是AMR的升級版,它也是使用ACELP技術。2000年12月時,ETSI/3GPP將AMR-WB標準化,並公佈於世。ITU-T在2002年採用它,並另命名爲G.722.2。

由於AMR-WB的語音帶寬很寬(50 Hz~7 kHz),所以它的語音品質很高。它具有9種採樣速率(都是非立體聲),分別是:23.85 kbps、23.05 kbps、19.85 kbps、18.25 kbps、15.85 kbps、14.25 kbps、12.65 kbps、8.85 kbps、6.6 kbps。其中,能夠保持高的語音品質,並且速率最低者是12.65 kbps。AMR-WB已經被UMTS/IMT-2000無線電網絡採用,作爲它的編譯碼基本技術;UMTS也是一種3G新標準。
  
AMR-WB+

2004年9月,ETSI/3GPP將AMR-WB+標準化。AMR-WB+是AMR-WB的升級版,它使用ACELP和TCX(Transform Coded Excitation)技術,提供高品質的語音和其它音頻內容──這包括:自然聲、數字音樂、與音樂相混合的聲音(voice-between-music/voice-over-music)。

AMR-WB+增加了立體聲信號和支持更高的採樣速率。並且,使用高效率的“參數立體聲”(HE-PS)技術,能夠以低速率傳輸高品質的立體聲。TCX轉換編碼技術則補償了ACELP的不足。

AMR-WB+的採樣速率是從6 kbps~48 kbps;立體聲的採樣速率是8 kbps~48 kbps,非立體聲的採樣速率是6 kbps~36 kbps。這使得它的語音帶寬更寬(24 kHz),接近CD的語音品質。此外,AMR-WB+可以和AMR-WB兼容。
  
技術比較

根據歐洲廣播聯盟(EBU)的人工測試(其方法稱爲MUSHRA),除AMR家族尚未測試以外,編譯碼後的語音品質最好者是AAC+,在採樣率爲48 kbps時,它的品質與CD一樣好。其它技術的語音品質,按優劣順序分別是:MP3PRO、AAC、Real 8、7 kHz LPF、WMA 8、MP3、Real G2、3.5 kHz LPF。
按照3GPP的分類,依傳輸率大小,可區分成兩類:

1. 低於或等於24 kbps者:ARM-WB+、HE-AAC/AAC+、EAAC+。
2. 高於24 kbps者:HE-AAC/AAC+、EAAC+。

根據3GPP的MUSHRA測試結果,ARM-WB+在採樣率爲48 kbps時的語音品質最高。若以ARM-WB+與EAAC+做比較,在採樣率低於24 kbps時,ARM-WB+的立體聲優於EAAC+。
  
結語

目前,AAC和AMR-WB技術已經被使用於2G和2.5手機中。而AAC+、EAAC+和AMR-WB+則被使用於3G手機中。它們的應用如圖1所示。音樂手機比視頻手機、電視手機更早被市場接受。但是,MP3播放機的價格卻一直下滑,所以,音樂手機或音樂播放機極需要AAC+、EAAC+和AMR-WB+的興起和普及,以帶動另一波的購買熱潮。

更好的語音編譯碼技術會繼續推陳換新,但到2010-2015年,當手機的傳輸率可達到1 Gbps時,追求效率更佳的編解碼技術的趨勢可能會逐漸消退,不過,編解碼技術的內涵仍然是很迷人的。
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章