AMR資料(2)

整體概述

 

資料(1)總結

全稱Adaptive Multi-Rate,自適應多速率編碼,主要用於移動設備的音頻,壓縮比比較大,但相對其他的壓縮格式質量比較差,由於多用於人聲,通話,效果還是很不錯的。

 

AMR包括AMR-NB和AMR-WB,

“AMR-WB”全稱爲“Adaptive Multi-rate - Wideband”,即自適應多速率寬帶編碼,採樣頻率爲16kHz,是一種同時被國際標準化組織ITU-T3GPP採用的寬帶語音編碼標準,也稱 G722.2標準。AMR-WB提供語音帶寬範圍達到507000Hz,用戶可主觀感受到話音比以前更加自然、舒適和易於分辨。

 

 

A.工學碩士學位論文 哈爾濱工程大學 樓佳
基於網絡QoS的AMR語音編碼算法研究

A Dissertation for the Degree of M. Eng
Research on Network QoS一based AMR Algorithm

1.2.2 AMR語音編碼算法
    數字語音編碼技術是語音數字化處理的重要組成部分,其隨着網絡語音
通信的迅速發展也得到了充分的關注以及發展[[s]。帶寬在網絡通信中是十分
寶貴的資源,語音編碼技術可以壓縮語音信號的傳輸帶寬,提高網絡語音通
信的網絡帶寬利用率[9]。語音信號存在着很多冗餘,包括時間冗餘、信息冗
餘、聽覺冗餘、知識冗餘和譜間冗餘等。採用語音編碼可以減小語音信號的
冗餘度、壓縮原始語音數據並重構出自然而真實的語音。
    採用變速率語音編碼技術是現代網絡語音通信的特點之一[[io],近年來越
來越廣泛地應用於無線通信的多址系統中。例如,在E-TDMA ( Extended-Time
Division Multiple Access),PRMA(Packet Reservation Multiple Access)和
CDMA中都用到了變速率語音編碼。
    在國際標準化工作中,語音編碼技術是最爲熱門的領域之一["] 0 20世紀
元年代,隨着CDMA移動通信系統的飛速發展,語音編碼技術受到相應的
關注,變速率語音編碼技術也逐漸成爲人們關注的焦點!,“]。各種通信組織爭
相推出了不同的變速率語音編碼技術標準,其中主要包括了QCELP, EVRC,
AMR, AMR-WB和SMV五種算法標準。
    AMR語音編碼器被廣泛地應用於第三代移動通信系統,它可以根據自適
應算法選擇當前信道最佳的語音編碼速率。每一語音幀的編碼速率都是由當
時的信道環境決定的。傳輸環境較爲理想時,選擇最佳的語音編碼模式;傳
輸環境較爲惡劣時,選擇最健壯的編碼模式,以此獲得最佳語音質量n]。在
移動通信中,決定編碼的自適應性的因素有:移動臺和網絡對信道質量的測
量,以及隨語音數據一起通過空中接口傳送的帶內信息。
    由於傳統IP網絡的“盡力而爲”的特點,不能爲語音傳輸提供可靠的端
到端服務質量保證,提高語音服務質量成爲現今急需解決的問題之一。採用
變速率語音編碼算法可以根據網絡實時狀態改變編碼速率,提供較佳的語音
通話質量[}'}} o AMR具有8種速率模式,如表1.1所示,分別是:12.2kbps,

 

第3章自適應AMR語音編碼算法研究
    AMR語音編碼器可以提供多種不同編碼速率,目前己經成爲移動通信領
域中廣泛使用的語音壓縮算法[’7}。本章首先介紹AMR編碼器的基本原理,
主要包括線性預測分析和碼書搜索兩個主要部分。然後簡略介紹了AMR解
碼器的工作過程。由於IP語音通信系統中,網絡負載流量是動態變化的,本
文提出基於實時網絡QoS參數估計的自適應AMR語音編碼算法,並進行了
仿真實驗,實驗結果驗證了所提出算法的有效性。

 

B.西安電子科技大學 張義

TM1300平臺下AMR_WB算法的研究與優化.nh

    1999年由Nokia和VoiceAje聯合開發了一種稱爲自適應多速率的低比特寬帶
聲碼器AMR-WB(Adaptive Multi-rate Wideband),它作爲WCDMA 3 G AMR聲碼器
的改進版本於2000年9月提交到3 GPP/ETSI,在2001年3月獲得了3 GPP/ET SI
批准作爲GSM和3G WCDMA的寬帶語音編碼標準。同時ITU-T也在2001年9
月和2002年1月批准了這個方案,ITU-T的標準是6.722.2 o AMR-WB以代數碼激
勵線性算法ACELP爲基礎,處理語音信號的帶寬擴展爲5 0-7000Hz,採樣率擴展
爲16kHz。其增加的50-200Hz低端頻率,大大提高了恢復語音的自然度、表現力
(presence)和舒適度。擴展的3400-7000Hz的高頻部分可以更好地區分摩擦音,增
加了清晰度,使說話方語音的個人特徵體現得更爲充分〔5]。當輸入信號以16kHz
採樣,16bit編碼後,原始速率爲256kbit/s,經過AMR-WB壓縮編碼後,可以根
據信道的質量不I I擁塞狀況分別採用23.85, 23.05, 19.85, 18.25,15.85, 14.25,   12.65,
8.85和6.60 kbit/s九種可變速率模式。同時AlVIR-WB採用了不連續語音傳輸
(DTX)、舒適噪聲生成和錯誤幀隱藏技術,大大提高了聲碼器的靈活性和信道抗幹
擾能力。

    由於a}-wB的低比特率,互操作性和高語音質量,使其不僅應用於無線通
信領域,而目_可廣泛應用於其他各種通信系統和平臺。包括:VoIP、囚特網、PSTN
高質量音頻會議、音頻流、1SDN寬帶電話、1SDN可視電話和電視會議等。因而
AMR-WB成爲唯一同時被無線系統} 3 GPP)和固網通信(ITU)同時採用的語音
壓縮算法標準「2‘〕。

 

c。貴州大學2006屆碩士研究生學位論文
AMR語音編碼器學科專業:微電子學與固體電子學研究方向:集成電路設計導師:傅興華
研究生:曹利兵中國·貴州·貴陽2009年5月

    3G的三大主流技術TD-SCDMA, WCDMA和CDMA2000都採用了變速率語音編碼技術。
其中,WCDMA與中國國家3G標準TD-S CDMA都是採用AMR(Adaptive Multi Rate)語音編碼
技術。第三代移動通信系統中的AMR語音編碼是爲了讓容錯度隨無線信道和傳輸環境的改
變而改變,因此人們稱之爲自適應。
    在現代無線通信系統中,網絡容量的有限性與不斷增長的用戶數量之間存在的矛盾日益
突出。採用高效的語音壓縮技術,可以有效地從信源上減少進入無線系統中的數據,從而達
到節約信道的目的。如果再結合有效的信道編碼技術,則可以大大緩解網絡容量與用戶數之
間的矛盾。
 

   語音編碼算法有很多種,但是大致可以分爲兩類:波形編碼方法和分析合成方法。其中波形編碼方法
又分爲時域波形編碼和變換域編碼,而分析合成方法實際上指的是參數編碼。現在實際使用的編碼方法是
所謂的“混合編碼”,它綜合運用了波形編碼方法和分析合成方法的技術優點。

1.4定速率語音編碼向變速率語音編碼的過渡

    傳統的定速率語音編碼從總體來講,較高速率的編碼算法對話音質量較易保證,但iii用網絡資源較人;
較低速率的編碼算法!}i用網絡資源小,但對話音質量較難保證。
    話音激活檢測(VAD)技術的出現和發展,使對有無話音進行判斷成爲可能,從而可以對背景噪聲和激
活的話音部分以不同的速率進行編碼,降低平均速率,也就是採用變速率語音編碼的方法。人類在進行語
音通信時,大約有70%左右的空閒時間沒有講話。始終用一個速率進行語音編解碼對信道資源是一個浪費。
因此能否在無話時編碼速率低一點,講話時編碼速率高一點,使平均速率降低下來?這個樸素的想法是有
可能實現的,那就是採用變速率語音編碼技術。白從變速率語音編碼算法誕生以來,因爲其不但可以根據
需要動態調整編碼速率,在合成語音質量和系統容量之間取得靈活的折衷,最大限度地發揮系統的效能,
而且非常適合分組交換網絡,故得到了很大的發展,逐漸成爲新的研究熱點。
    變速率語音壓縮編碼理論上仍屬於CELP,但在“變”上有了新的研究,由此引入了相關的先進技術。
這些相關的技術主要包括:用來檢測譜音通信時是否有話音存在的話音激活檢測(VAD >  Voice Activity
Detector)技術、爲突出“變”字而進行速率判決(RDA }  Rate Decision Algorithm)的白適應技術、爲避免語
音幀丟失後帶來負面效應的差錯隱藏(ECU>  Error}Concealment Units)技術、爲克服背景噪聲不連續的舒適
背景噪聲((CAN. Comfort Noise Aspects)生成技術等等。這些相關技術的應用使變速率語音編碼之後的語音
合成效果兒乎沒有降低。

1.5變速率語音編碼的發展現狀

    移動通信系統從第一代發展到第二代,包含了從模擬語音信道到數字語音信道的轉變,用數字化方法
研究語音處理技術,使人們能更加有效地產生、傳輸、存儲和獲取語音信息,這對於促進社會的發展具有
十分重要的意義。作爲語音數字化處理的一個重要分支,數字語音編碼技術得到了長足發展。隨着通信技
術的高速發展,頻率資源變得更加寶貴,語音編碼技術可以壓縮語音信號的傳輸帶寬,增加通信系統的容
量。實際上,語音信號存在着大量冗餘,如信息冗餘、時間冗餘、譜間冗餘、聽覺冗餘和知識冗餘等,採
用各種語音編碼技術的目的就是爲了去除語音信號的冗餘度,壓縮原始語音數據,合成出可懂度和自然度
較好的語音ftzl0
    第三代移動通信系統的特點之一就是採用變速率語音編碼技術。變速率編碼算法的進一步研究,其算
法符合聲音的特性,適配分組交換網絡,在第三代移動通信系統中具有很好的發展前景。當然,變速率語
音編碼的傳統應用還包括語音存儲、分組應用和用於數字電路倍增設備(DCME)的數字話音插空((DSI)。近
年來,它在無線通信的多址系統中應用得越來越)’一泛。例如,在E-TDMA(Extended-Time Division Multiple
Access), PRMA(Packet Reservation Multiple Access)CDMA(Code Division Multiple Access)中都用到了變速率
語音編碼。
    語音編碼技術在國際標準化_!幾作中可稱爲最活躍的領域之一。20世紀90年代,CDMA移動通信系統
的飛速發展,及其對語音編碼技術的進一步要求,把變速率語音編碼技術推上了前臺。各種通信組織相繼
推出了不同的變速率語音編碼技術標準。主要包括QCELP, EVRC, AMR, AMR-WB和SMV五種算法
標準ft3]。
1.6變速率語音編碼的速率控制方式
    變速率語音編碼通常採用速率控制,土要有二種方式:源控制、信道控制和網絡控制。
    源控制變速率語音編碼就是根據語音的聲道(短時)特性,以一定形式動態分配比特數。典型的源控制
變速率編碼器採用了話音激活技術。在一般的電話通信中,每幀信號中的信息量是不同的。當通話一方沒
有說話時,信號幀就只包含背景噪聲,當他說話時,也會有些幀只發清音,這就只需要用較低的速率來進
行編碼,而對激活話音部分用較高的速率進行編碼。
    根據信道的質量來改變每幀語音信號的編碼速率,叫做信道控制。在壞的信道條件(深衰落)一F,信道
編碼中的兀餘比特數不足以糾正傳輸錯誤,這時應提高信道編碼速率(增加冗餘比特數)而減小語音編碼速
率來保障通話質量;相反,在好的信道條件下,應增加語音編碼速率來提高語音質量。
    變速率語音編碼還用於解決蜂窩移動系統中的網絡擁塞問題,即網絡控制。通過改變每個用戶可用的
平均比特率,網絡可以在容量和通話質L中取得較好的折衷。這樣的網絡可以在大部分時間提供很好的ip
音質量,在高峯時段又可爲大量的用戶提供可以接受的通話質量。
    在前述算法中,QCELP和EVRC兩種算法屬於源控制變速率語音編碼,而AMR和SMV兩種算法則
屬於源控制和信道控制相結合的變速率語音編碼。
.7變速率語音編碼的發展方向
    隨着移動通信的飛速發展,用變速語音編碼來提高頻帶的有效利用程度,將是未來數字蜂窩和微蜂窩
網的必然發展趨勢。爲了獲得更加實用的變速率算法,人們將對變速率語音編碼的白適應技術進行更深入
的研究,在將來的通信系統中,除了前面介紹的二種方式以外,由用戶控制也是可能的,也就是說,用戶
可能選擇平均比特率米控制通一話的質量。這樣的控制允許用戶限制移動傳輸的功率,這會增加誤碼率和所
需的前向糾錯的程度,因此就必須減少用作語音編碼的比特數。當然,將來的通信系統也可能綜合考慮兒
種控制方式的有機結合,使系統更好地發揮作用,用戶更加滿意,從而增強競爭力。但由T通信系統的復
雜性,這不是一個簡單的問題,需要從多方面進行考慮【’3]。
    另外,語音壓縮編碼的依據,一方面是語音信號本身存在很大的冗餘度,主要體現在:
(1)、語音信號樣本間有很強的相關性,即短時譜是不平坦的。
(2),濁音語音段具有準週期特性。
(3)、聲道的形狀及其變化的速率是有限的。
(4)傳輸碼值的概率分佈是非均勻的。
另一方面是人耳的聽覺心理特性,主要體現在:
(1)、人耳對不同頻段的聲音敏感程度不同,通常對低頻比對高頻敏感一些。
(2)、人耳對語音信號的絕對相位不敏感。
    (3)、人耳有“掩蔽”效應(Masking Effect)即一個強音能抑制一個同時存在的弱音的聽覺現象。對人
耳聽不到或極不敏感的聲音分量可以看作是冗餘。語音壓縮編碼本質上是設法去掉這些兀餘度,從而達到
壓縮比特率的目的。
    因此,有理由認爲,未來變速率語音壓縮技術的研究也將在所採用的基礎語音編碼技術上做更多的I.
作,土要體現在以’卜三個方面:
    1、對速率判決和控制的進一步改進
    通過對速率判決算法的改進提高編碼的效率。把更精確的話音檢測技術應用到速率判決算法中來,使
速率判斷更符合語音特性,從而進一步降低編碼速率或者提高合成語音質量。對CDMA通信系統本身也
可以做進一步研究,速率控制機制也可以進一步改進,更多地考慮用戶的需要和信道的實際情況,使速率
控制更加靈活、有效。
    2、與新的低速率語音編碼技術的結合
    近年來又出現了很多新的低速率語音編碼方案。人們可以對低速率語音編碼作進一步研究,並與變速
率語音編碼相結合,以獲得更低的平均編碼速率,或者採用其中的一些技術,用來提高合成語音的質量。
    3、對CDMA通信系統特點的研究
    CDMA通信系統本身有很多不同於傳統通信系統的地方,這些特性對採用的語音編碼算法也會有影
響。通過對CDMA系統特性的研究,可以改進語音編碼算法中的不足之處,增強魯棒性(robustness),使之
更適應於通信系統的需要。

 

d。基於TM 1300實現AM R一WB語音壓縮算法優化 張義’,J(1. 68016部隊甘肅張掖731000  姚中華’
2. }安電子科技大學西安710071)張義的另外一篇發表期刊“北京電子利技學院學報”

引言
    .,.I前在一代(2G)和二代移動通信系統OG)}I}採用的聲碼器均爲帶寬限制在200一  340011的窄帶聲碼器。隨着尤線通信
系統逐步由基本話音服務向多媒體及高速數據服務的發展,研究新的適合尤線系統的多速率、低碼率、‘覓帶必0一  700011力聲
碼器變得尤爲迫切。1999年V ok is和V oiceA ge公司聯合開發了種稱爲自適應多速率(A M R -W T3 , A daptive M u lti-R ate
W ideband)的寬帶聲碼器,並十2000年9月將方案提交到3GPPfiTS丁。2001年3月,這個方案獲得通過並被確定爲G SM和
3G W-CDMA的寬帶語音編碼標準。1TU -T在2001年9月被批准,並在2002年1月定爲6.722.2標準叭
    AMR-W T3採用16k11採樣速率,採樣帶寬爲50刀00011 z,原始語音速率爲256kbps}      #}對十II前J}線系統的窄帶聲碼
器,}II:GSM增強個速聲1i器Q?nhenced PuI}R ate, 1?PR ).CDM A模式可選聲1i器冬elective M ode V ocoder, SM V ).3G W C D M A
b適應多速率語音編碼器AM R .CDM A2000增強型可變速率編碼1?VRC (TS-127)及R碼激勵線性預測聲碼器QCl?LP (8K,
73K),AMR-W T3增加了50-20011 z低端頻率,提高了恢復語音的自然度、表現力如二二。ce)和舒適度,擴展的3400-700011的
高頻部分可以更好地區分摩擦音,增加了清晰度,使說話方語音的個人特徵體現得更爲充分[rn們爲適合尤線系統的聲1馬
器,AMR-W 13包含了語音端點檢測}VAD}_源速率控制}BOR}_舒適噪聲生成、去幀從幀錯誤隱藏等模塊,並且能夠根據尤
線信逝質量和擁塞情況,靈活地採用6.60, 8.85, 7 2.55, 7 x.25, 7 5.85, 7 9.85, 23.05, 23.85K h誠等}L種編碼輸出速率模式,其,},
7 2.55kbi磚及以上速率模式能夠提供高質量寬帶語音質量。
    A M R -4V T3的低比特率,互操們性和高語音質量,使其不僅應用十尤線通信領域,而且可廣泛應用十吝種通信系統和平
臺,包括V o1P、因特網、PSTV高質量音頻會議、音頻流、TSD V寬帶電話,TSDV可視電話和電視會議等。因而A M R -4V T3成爲
唯被尤線系統(3G PP)和固網通信(TTU )同時採用的語音扭縮算法標準叭
還有一部分放到word文檔上面了。




 

 


 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章