音頻編碼技術G.729與G.711

VoIP中G.729與G.711的部分資料

由於用上了VoIP網關設備,在設置界面裏關於語音壓縮的設置裏有5種標準可選,分別是G.711-uLaw、G.711-aLaw、G.723-53k、G.723-63k、G729,G.711和G.729是企業VoIP部署中非常流行的兩種編解碼器。與通過G.729編碼的語音流相比,G.711音質表現出色。G.711通常用於不存在帶寬問題的LAN環境,帶寬需求約爲80kbps,其中包括開銷帶寬。G.729通常用於帶寬有限的WAN環境,帶寬需求約爲30kbps。

G.711是語音模擬信號的一種非線性量化,細分有二種:G.711 A-law 和 G.711 u-law。不同的國家和地方都會選取一種作爲自己的標準。G.711 bitrate 是64kbps。詳細的資料可以在ITU 上下到相關的spec,下面主要列出一些性能參數:

G.711(PCM方式:PCM=脈碼調製 :Pulse Code Modulation)

採樣率:8kHz

信息量:64kbps/channel

理論延遲:0.125msec

品質:MOS值4.10

G.723.1是一個雙速率的語音編碼器,是ITU-T建議的應用於低速率多媒體服務中語音或其它音頻信號的壓縮算法;其目標應用系統包括H.323、H.324等多媒體通信系統,目前該算法已成爲IP電話系統中的必選算法之一;編碼器的幀長爲30ms,還有7.5ms的前瞻,編碼器的算法時延爲37.5ms;編碼器首先對語音信號進行傳統電話帶寬的濾波(基於G.712),再對語音信號用傳統8000-Hz速率進行抽樣(基於G.711),並變換成16 bit線性PCM碼作爲該編碼器的輸入。

在解碼器中對輸出進行逆操作來重構語音信號;高速率編碼器使用多脈衝最大似然量化(MP-MLQ),低速率編碼器使用代數碼激勵線性預測(ACELP)方法,編碼器和解碼器都必須支持此兩種速率,並能夠在幀間對兩種速率進行轉換。此係統同樣能夠對音樂和其他音頻信號進行壓縮和解壓縮,但它對語音信號來說是最優的;採用了執行不連續傳輸的靜音壓縮,這就意味着在靜音期間的比特流中加入了人爲的噪聲。除了預留帶寬之外,這種技術使發信機的調制解調器保持連續工作,並且避免了載波信號的時通時斷。

G.729採用的算法是共軛結構的代數碼激勵線性預測(CSACELP),是基於CELP編碼模型的算法;能夠實現很高的語音質量(長話音質)和很低的算法延世;算法幀長爲10ms,編碼器含5ms前瞻,算法時延15ms;其重建語音質量在大多數工作環境下等同於32kb/s的ADPCM(G.726),MOS分大於4.0;編碼時輸入16bitPCM語音信號,輸出2進制比特流;譯碼時輸入爲2進制比特流,輸出16bitPCM語音信號;在語音信號8KHz取樣的基礎上,16bit線性PCM後進行編碼,壓縮後數據速率爲8Kbps;具有相當於16:1的壓縮率。

G.729系列在當前的VOIP得到廣泛的應用,且相關分支較多,可以直接從ITU網上得到source code和相關文檔。

G.729(CS-ACELP方式:Conjugate Structure Algebraic Code Excited Linear Prediction)

採樣率:8kHz

信息量:8kbps/channel

幀長:10msec

理論延遲:15msec

品質:MOS值3.9

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章