視頻編碼之釋——從H.261 到H.264

本文轉載

http://www.cnii.com.cn/20050801/ca345379.htm

(2006-02-06 11:39:38)

數字視頻技術廣泛應用於通信、計算機、廣播電視等領域，帶來了會議電視、可視電話及數字電視、媒體存儲等一系列應用，促使了許多視頻編碼標準的產生。ITU-T 與ISO/IEC 是制定視頻編碼標準的兩大組織，ITU-T 的標準包

括H.261、H.262、H.263、H.264，主要應用於實時視頻通信領域，如會議電視；MPEG 系列標準是由ISO/IEC制定的，主要應用於視頻存儲(DVD)、廣播電視、因特網或無線網上的流媒體等。兩個組織也共同制定了一些標準，H.262 標準等同於MPEG-2 的視頻編碼標準，而目前最熱門的H.264 標準則是MPEG-4 的第10 部分。

視頻編碼標準的發展

H.261 視頻編碼標準

H.261 是ITU-T 爲在綜合業務數字網(ISDN)上開展雙向聲像業務(可視電話、視頻會議)而制定的，速率爲64kb/s的整數倍。H.261 只對CIF 和QCIF 兩種圖像格式進行處理，每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。

H.261 是最早的運動圖像壓縮標準，它詳細制定了視頻編碼的各個部分，包括運動補償的幀間預測、DCT 變換、量化、熵編碼，以及與固定速率的信道相適配的速率控制等部分。

H.262 視頻編碼標準（又稱MPEG-2）

由MPEG-1 擴充而來，支持隔行掃描。使用十分廣泛，幾乎用於所有的數字電視系統，適合標清和高清電視，適合各種媒體傳輸，包括衛星、有線、地面等，都能有效地傳輸。

H.263 視頻編碼標準

H.263 是最早用於低碼率視頻編碼的ITU-T 標準，是ITU-T 爲低於64kb/s 的窄帶通信信道制定的視頻編碼標準。它是在H.261 基礎上發展起來的，其標準輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF 或者16CIF 的彩色4∶2∶0 亞取樣圖像。H.263 與H.261 相比採用了半象素的運動補償，並增加了4 種有效的壓縮編碼模式。隨後出現的第二版(H.263+)及H.263++增加了許多選項，使其具有更廣泛的適用性。

H.264 視頻編碼標準

H.264 是由ISO/IEC 與ITU-T 組成的聯合視頻組(JVT)制定的新一代視頻壓縮編碼標準。1996 年制定H.263標準後，ITU-T 的視頻編碼專家組(VCEG)開始了兩個方面的研究：一個是短期研究計劃，在H.263 基礎上增加選項(之後產生了H.263+與H.263++)；另一個是長期研究計劃，制定一種新標準以支持低碼率的視頻通信。長期研究計劃產生了H.26L 標準草案，其目標是研製出新的壓縮標準，與以前的任何標準相比，效率要提高一倍，同時具有簡單、直觀的視頻編碼技術，網絡友好的視頻描述，適合交互和非交互式應用（廣播、存儲、流煤體）。

2001 年，ISO 的MPEG 組織認識到H.26L 潛在的優勢，隨後ISO 與ITU 開始組建包括來自ISO/IEC MPEG與ITU-T VCEG 的聯合視頻組(JVT)，JVT 的主要任務就是將H.26L 草案發展爲一個國際性標準。於是，在ISO/IEC中該標準命名爲AVC(Advanced Video Coding)，作爲MPEG-4 標準的第10 個選項；在ITU-T 中正式命名爲H.264標準。該標準在2003 年3 月正式獲得批准。

H.264 視頻編碼標準特性

H.264 的主要優點包括:

1. 在相同的重建圖像質量下，H.264 比H.263+和MPEG-4(SP)減小50%碼率。

2. 對信道時延的適應性較強，既可工作於低時延模式以滿足實時業務，如會議電視等；又可工作於無時延限制的場合，如視頻存儲等。

3. 提高網絡適應性，採用“網絡友好”的結構和語法，加強對誤碼和丟包的處理，提高解碼器的差錯恢復能力。

4. 在編/解碼器中採用複雜度可分級設計，在圖像質量和編碼處理之間可分級，以適應不同複雜度的應用。

相對於先期的視頻壓縮標準，H.264 引入了很多先進的技術，包括4×4 整數變換、空域內的幀內預測、1/4 象素精度的運動估計、多參考幀與多種大小塊的幀間預測技術等。新技術帶來了較高的壓縮比，同時大大提高了算法的複雜度。

4×4 整數變換

以前的標準，如H.263 或MPEG-4，都是採用8x8 的DCT 變換。H.26L 中建議的整數變換實際上接近於4×4的DCT 變換，整數的引入降低了算法的複雜度，也避免了反變換的失配問題，4×4 的塊可以減小塊效應。而H.264的4×4 整數變換進一步降低了算法的複雜度，相比H.26L 中建議的整數變換，對於9b 輸入殘差數據，由以前的32b 降爲現在的16b 運算，而且整個變換無乘法，只需加法和一些移位運算。新的變換對編碼的性能幾乎沒有影響，而且實際編碼略好一些。

基於空域的幀內預測技術

視頻編碼是通過去除圖像的空間與時間相關性來達到壓縮的目的。空間相關性通過有效的變換來去除，如DCT變換、H.264 的整數變換；時間相關性則通過幀間預測來去除。這裏所說的變換去除空間相關性，僅僅侷限在所變換的塊內，如8×8 或者4×4，並沒有塊與塊之間的處理。H.263+與MPEG-4 引入了幀內預測技術，在變換域中根據相臨塊對當前塊的某些係數做預測。H.264 則是在空域中，利用當前塊的相臨象素直接對每個係數做預測，更有效地去除相臨塊之間的相關性，極大地提高了幀內編碼的效率。

H.264 基本部分的幀內預測包括9 種4×4 亮度塊的預測、4 種16×16 亮度塊的預測和4 種色度塊的預測。

運動估計

H.264 的運動估計具有3 個新的特點：1/4 象素精度的運動估計；7 種大小不同的塊進行匹配；前向與後向多參考幀。

H.264 在幀間編碼中，一個宏塊(16×16)可以被分爲16×8、8×16、8×8 的塊，而8×8 的塊被稱爲子宏塊，又可以分爲8×4、4×8、4×4 的塊。總體而言，共有7 種大小不同的塊做運動估計，以找出最匹配的類型。與以往標準的P 幀、B 幀不同，H.264 採用了前向與後向多個參考幀的預測。半象素精度的運動估計比整象素運動估計有效地提高了壓縮比，而1/4 象素精度的運動估計可帶來更好的壓縮效果。

編碼器中運用多種大小不同的塊進行運動估計，可節省15%以上的比特率(相對於16×16 的塊)。運用1/4 象素精度的運動估計，可以節省20%的碼率(相對於整象素預測)。多參考幀預測方面，假設爲5 個參考幀預測，相對於一個參考幀，可降低5%～10%的碼率。以上百分比都是統計數據，不同視頻因其細節特徵與運動情況而有所差異。

去塊效應濾波器

H.264 標準引入了去塊效應濾波器，對塊的邊界進行濾波，濾波強度與塊的編碼模式、運動矢量及塊的係數有關。去塊效應濾波器在提高壓縮效率的同時，改善了圖像的主觀效果。

其他視頻編碼標準

除上述ITU-T 的視頻壓縮標準外，還有一些標準也比較流行，如MPEG-4、WM9。

目前國內所說的MPEG-4 一般是指SP(簡級)或ASP(先進的簡級)，主要針對低碼率應用，如因特網上的流媒體、無線網的視頻傳輸及視頻存儲等，其核心類似於H.263，編碼效率也與H.263 相當。

MPEG-4 SP 和H.263 有很多相似的地方。然而，這兩個標準之間也有顯著的不同，主要表現在：碼流結構和頭信息、熵編碼的部分碼錶、編碼技術的一些細節。MPEG-4 ASP 較SP 增加了一些技術，主要有：1/4 象素精度的運動估計、B 幀、全局運動矢量(GMV)，因而壓縮效率得以提高。

Window Meida 9(WM9)是微軟公司開發的新一代數字媒體技術。一些測試表明，WM9 的視頻壓縮效率比MPEG-2、MPEG-4 SP 及H.263 高很多，而與H.264 的壓縮效率相當。

綜述

H.261 與H.263 在視頻通信中應用較廣，成熟的產品有很多。H.263 與H.261 相比，增加了若干選項，提供了更靈活的編碼方式，壓縮效率大大提高，更適應網絡傳輸。

H.264 標準的推出，是視頻編碼標準的一次里程碑式的重要進步，它與現有的MPEG-2、MPEG-4 SP 及H.263相比，具有明顯的優越性，特別是在編碼效率上的提高，使之能用於許多新的領域。儘管H.264 的算法複雜度是現有編碼壓縮標準的4 倍以上，隨着集成電路技術的快速發展，以及受到業界幾乎所有主流視頻相關設備/產品廠商的支持，H.264 的商業應用已經在全世界迅速推廣。

(諾衝廣電在線央視科技)

視頻編碼之釋——從H.261 到H.264

sm4加密工具類

視頻編碼之釋——從H.261 到H.264

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結