視頻編碼之釋——從H.261 到H.264

本文轉載

http://www.cnii.com.cn/20050801/ca345379.htm

 

 

視頻編碼之釋——從H.261 到H.264


(2006-02-06 11:39:38)

數字視頻技術廣泛應用於通信、計算機、廣播電視等領域,帶來了會議電視、可視電話及數字電視、媒體存儲等一系列應用,促使了許多視頻編碼標準的產生。ITU-T 與ISO/IEC 是制定視頻編碼標準的兩大組織,ITU-T 的標準包

括H.261、H.262、H.263、H.264,主要應用於實時視頻通信領域,如會議電視;MPEG 系列標準是由ISO/IEC制定的,主要應用於視頻存儲(DVD)、廣播電視、因特網或無線網上的流媒體等。兩個組織也共同制定了一些標準,H.262 標準等同於MPEG-2 的視頻編碼標準,而目前最熱門的H.264 標準則是MPEG-4 的第10 部分。

視頻編碼標準的發展

H.261 視頻編碼標準

H.261 是ITU-T 爲在綜合業務數字網(ISDN)上開展雙向聲像業務(可視電話、視頻會議)而制定的,速率爲64kb/s的整數倍。H.261 只對CIF 和QCIF 兩種圖像格式進行處理,每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。

H.261 是最早的運動圖像壓縮標準,它詳細制定了視頻編碼的各個部分,包括運動補償的幀間預測、DCT 變換、量化、熵編碼,以及與固定速率的信道相適配的速率控制等部分。

H.262 視頻編碼標準(又稱MPEG-2)

由MPEG-1 擴充而來,支持隔行掃描。使用十分廣泛,幾乎用於所有的數字電視系統,適合標清和高清電視,適合各種媒體傳輸,包括衛星、有線、地面等,都能有效地傳輸。

H.263 視頻編碼標準

H.263 是最早用於低碼率視頻編碼的ITU-T 標準,是ITU-T 爲低於64kb/s 的窄帶通信信道制定的視頻編碼標準。它是在H.261 基礎上發展起來的,其標準輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF 或者16CIF 的彩色4∶2∶0 亞取樣圖像。H.263 與H.261 相比採用了半象素的運動補償,並增加了4 種有效的壓縮編碼模式。隨後出現的第二版(H.263+)及H.263++增加了許多選項,使其具有更廣泛的適用性。

H.264 視頻編碼標準

H.264 是由ISO/IEC 與ITU-T 組成的聯合視頻組(JVT)制定的新一代視頻壓縮編碼標準。1996 年制定H.263標準後,ITU-T 的視頻編碼專家組(VCEG)開始了兩個方面的研究:一個是短期研究計劃,在H.263 基礎上增加選項(之後產生了H.263+與H.263++);另一個是長期研究計劃,制定一種新標準以支持低碼率的視頻通信。長期研究計劃產生了H.26L 標準草案,其目標是研製出新的壓縮標準,與以前的任何標準相比,效率要提高一倍,同時具有簡單、直觀的視頻編碼技術,網絡友好的視頻描述,適合交互和非交互式應用(廣播、存儲、流煤體)。

2001 年,ISO 的MPEG 組織認識到H.26L 潛在的優勢,隨後ISO 與ITU 開始組建包括來自ISO/IEC MPEG與ITU-T VCEG 的聯合視頻組(JVT),JVT 的主要任務就是將H.26L 草案發展爲一個國際性標準。於是,在ISO/IEC中該標準命名爲AVC(Advanced Video Coding),作爲MPEG-4 標準的第10 個選項;在ITU-T 中正式命名爲H.264標準。該標準在2003 年3 月正式獲得批准。

H.264 視頻編碼標準特性

H.264 的主要優點包括:

1. 在相同的重建圖像質量下,H.264 比H.263+和MPEG-4(SP)減小50%碼率。

2. 對信道時延的適應性較強,既可工作於低時延模式以滿足實時業務,如會議電視等;又可工作於無時延限制的場合,如視頻存儲等。

3. 提高網絡適應性,採用“網絡友好”的結構和語法,加強對誤碼和丟包的處理,提高解碼器的差錯恢復能力。

4. 在編/解碼器中採用複雜度可分級設計,在圖像質量和編碼處理之間可分級,以適應不同複雜度的應用。

相對於先期的視頻壓縮標準,H.264 引入了很多先進的技術,包括4×4 整數變換、空域內的幀內預測、1/4 象素精度的運動估計、多參考幀與多種大小塊的幀間預測技術等。新技術帶來了較高的壓縮比,同時大大提高了算法的複雜度。

4×4 整數變換

以前的標準,如H.263 或MPEG-4,都是採用8x8 的DCT 變換。H.26L 中建議的整數變換實際上接近於4×4的DCT 變換,整數的引入降低了算法的複雜度,也避免了反變換的失配問題,4×4 的塊可以減小塊效應。而H.264的4×4 整數變換進一步降低了算法的複雜度,相比H.26L 中建議的整數變換,對於9b 輸入殘差數據,由以前的32b 降爲現在的16b 運算,而且整個變換無乘法,只需加法和一些移位運算。新的變換對編碼的性能幾乎沒有影響,而且實際編碼略好一些。

基於空域的幀內預測技術

視頻編碼是通過去除圖像的空間與時間相關性來達到壓縮的目的。空間相關性通過有效的變換來去除,如DCT變換、H.264 的整數變換;時間相關性則通過幀間預測來去除。這裏所說的變換去除空間相關性,僅僅侷限在所變換的塊內,如8×8 或者4×4,並沒有塊與塊之間的處理。H.263+與MPEG-4 引入了幀內預測技術,在變換域中根據相臨塊對當前塊的某些係數做預測。H.264 則是在空域中,利用當前塊的相臨象素直接對每個係數做預測,更有效地去除相臨塊之間的相關性,極大地提高了幀內編碼的效率。

H.264 基本部分的幀內預測包括9 種4×4 亮度塊的預測、4 種16×16 亮度塊的預測和4 種色度塊的預測。

運動估計

H.264 的運動估計具有3 個新的特點:1/4 象素精度的運動估計;7 種大小不同的塊進行匹配;前向與後向多參考幀。

H.264 在幀間編碼中,一個宏塊(16×16)可以被分爲16×8、8×16、8×8 的塊,而8×8 的塊被稱爲子宏塊,又可以分爲8×4、4×8、4×4 的塊。總體而言,共有7 種大小不同的塊做運動估計,以找出最匹配的類型。與以往標準的P 幀、B 幀不同,H.264 採用了前向與後向多個參考幀的預測。半象素精度的運動估計比整象素運動估計有效地提高了壓縮比,而1/4 象素精度的運動估計可帶來更好的壓縮效果。

編碼器中運用多種大小不同的塊進行運動估計,可節省15%以上的比特率(相對於16×16 的塊)。運用1/4 象素精度的運動估計,可以節省20%的碼率(相對於整象素預測)。多參考幀預測方面,假設爲5 個參考幀預測,相對於一個參考幀,可降低5%~10%的碼率。以上百分比都是統計數據,不同視頻因其細節特徵與運動情況而有所差異。

去塊效應濾波器

H.264 標準引入了去塊效應濾波器,對塊的邊界進行濾波,濾波強度與塊的編碼模式、運動矢量及塊的係數有關。去塊效應濾波器在提高壓縮效率的同時,改善了圖像的主觀效果。

其他視頻編碼標準

除上述ITU-T 的視頻壓縮標準外,還有一些標準也比較流行,如MPEG-4、WM9。

目前國內所說的MPEG-4 一般是指SP(簡級)或ASP(先進的簡級),主要針對低碼率應用,如因特網上的流媒體、無線網的視頻傳輸及視頻存儲等,其核心類似於H.263,編碼效率也與H.263 相當。

MPEG-4 SP 和H.263 有很多相似的地方。然而,這兩個標準之間也有顯著的不同,主要表現在:碼流結構和頭信息、熵編碼的部分碼錶、編碼技術的一些細節。MPEG-4 ASP 較SP 增加了一些技術,主要有:1/4 象素精度的運動估計、B 幀、全局運動矢量(GMV),因而壓縮效率得以提高。

Window Meida 9(WM9)是微軟公司開發的新一代數字媒體技術。一些測試表明,WM9 的視頻壓縮效率比MPEG-2、MPEG-4 SP 及H.263 高很多,而與H.264 的壓縮效率相當。

綜述

H.261 與H.263 在視頻通信中應用較廣,成熟的產品有很多。H.263 與H.261 相比,增加了若干選項,提供了更靈活的編碼方式,壓縮效率大大提高,更適應網絡傳輸。

H.264 標準的推出,是視頻編碼標準的一次里程碑式的重要進步,它與現有的MPEG-2、MPEG-4 SP 及H.263相比,具有明顯的優越性,特別是在編碼效率上的提高,使之能用於許多新的領域。儘管H.264 的算法複雜度是現有編碼壓縮標準的4 倍以上,隨着集成電路技術的快速發展,以及受到業界幾乎所有主流視頻相關設備/產品廠商的支持,H.264 的商業應用已經在全世界迅速推廣。

(諾衝 廣電在線 央視科技)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章