音頻編碼技術G.729與G.711

原創

2020-02-23 09:08

VoIP中G.729與G.711的部分資料

由於用上了VoIP網關設備，在設置界面裏關於語音壓縮的設置裏有5種標準可選，分別是G.711-uLaw、G.711-aLaw、G.723-53k、G.723-63k、G729，G.711和G.729是企業VoIP部署中非常流行的兩種編解碼器。與通過G.729編碼的語音流相比，G.711音質表現出色。G.711通常用於不存在帶寬問題的LAN環境，帶寬需求約爲80kbps，其中包括開銷帶寬。G.729通常用於帶寬有限的WAN環境，帶寬需求約爲30kbps。

G.711是語音模擬信號的一種非線性量化，細分有二種：G.711 A-law 和 G.711 u-law。不同的國家和地方都會選取一種作爲自己的標準。G.711 bitrate 是64kbps。詳細的資料可以在ITU 上下到相關的spec，下面主要列出一些性能參數：

G.711（PCM方式：PCM＝脈碼調製：Pulse Code Modulation）

採樣率：8kHz

信息量：64kbps/channel

理論延遲：0.125msec

品質：MOS值4.10

G.723.1是一個雙速率的語音編碼器，是ITU-T建議的應用於低速率多媒體服務中語音或其它音頻信號的壓縮算法；其目標應用系統包括H.323、H.324等多媒體通信系統，目前該算法已成爲IP電話系統中的必選算法之一；編碼器的幀長爲30ms，還有7.5ms的前瞻，編碼器的算法時延爲37.5ms；編碼器首先對語音信號進行傳統電話帶寬的濾波（基於G.712），再對語音信號用傳統8000-Hz速率進行抽樣（基於G.711），並變換成16 bit線性PCM碼作爲該編碼器的輸入。

在解碼器中對輸出進行逆操作來重構語音信號；高速率編碼器使用多脈衝最大似然量化（MP-MLQ），低速率編碼器使用代數碼激勵線性預測（ACELP）方法，編碼器和解碼器都必須支持此兩種速率，並能夠在幀間對兩種速率進行轉換。此係統同樣能夠對音樂和其他音頻信號進行壓縮和解壓縮，但它對語音信號來說是最優的；採用了執行不連續傳輸的靜音壓縮，這就意味着在靜音期間的比特流中加入了人爲的噪聲。除了預留帶寬之外，這種技術使發信機的調制解調器保持連續工作，並且避免了載波信號的時通時斷。

G.729採用的算法是共軛結構的代數碼激勵線性預測(CSACELP)，是基於CELP編碼模型的算法；能夠實現很高的語音質量（長話音質）和很低的算法延世；算法幀長爲10ms，編碼器含5ms前瞻，算法時延15ms；其重建語音質量在大多數工作環境下等同於32kb/s的ADPCM（G.726），MOS分大於4.0；編碼時輸入16bitPCM語音信號，輸出2進制比特流；譯碼時輸入爲2進制比特流，輸出16bitPCM語音信號；在語音信號8KHz取樣的基礎上，16bit線性PCM後進行編碼，壓縮後數據速率爲8Kbps；具有相當於16:1的壓縮率。

G.729系列在當前的VOIP得到廣泛的應用，且相關分支較多，可以直接從ITU網上得到source code和相關文檔。

G.729（CS-ACELP方式：Conjugate Structure Algebraic Code Excited Linear Prediction）

採樣率：8kHz

信息量：8kbps/channel

幀長：10msec

理論延遲：15msec

品質：MOS值3.9

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

音頻編碼技術G.729與G.711

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

Android音頻架構性能分析

ANDROID音頻系統散記之二：resample-1(SRC)

ANDROID音頻系統散記之三：resample-2 (SRC)

音頻編碼技術G.729與G.711

Audio Resampler Implement

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結