視訊應用技術解析

隨着視頻通訊應用技術的不斷髮展和完善,越來越多的行業用戶接受和使用視頻通信產品。但在傳統視頻通訊技術標準下,由於受到視頻通訊應用技術和音視頻編解碼技術發展的制約,視頻通訊技術到現在還沒有從根本上解決通訊過程中的圖像和聲音問題。低等級的視頻質量無法滿足用戶對高清晰圖像質量的特殊需求。

傳統視頻通訊的主要問題是:經過編解碼後的圖像在解析度、色彩還原度等方面和真實場景有較大的差距。造成這一現象的原因方面是由於編解碼設備的編解碼效率低、鏈路動態適應能力差等諸多因素導致對真場景還原失真。另外在音頻方面,傳統的50Hz-7KHz只能感受到較窄的音頻寬度並不能對現場環境和聲音特徵進行有效還原,需要音頻編解碼提供更高的音頻採樣率,以實現更寬的音頻效果。在現實運用中,人們對於視頻的圖像和聲音的要求越來越高,例如:遠程醫療、遠程手術;遠程維修等需要通過視頻通訊這一過程實現對現場情況的精確視頻傳輸(高清晰視頻應用)。所以就需要我們提供更高視頻通訊質量的高清晰視頻通訊產品。因此佰銳科技推出了基於標準的H.264;H.264的高清晰視頻通訊產品AnychatIcloudsoft等系列。

高清晰視頻通訊技術的選擇:

視頻要求:

視頻通訊應用作爲一種媒體應用方式同樣需要遵循各標準組織所倡導的高清晰多媒體標準。當前高清晰數字電視(HDTV)所倡導的視頻解析度主要有三種格式,分別爲720P1080I1080P (其中“P”爲逐行掃描方式;“I”爲隔行掃描方式)。而高清晰視頻通訊主要應用格式爲:720P——即逐行720線。

視頻通訊採用逐行掃描的原因在於,視頻會議場景通常對動態圖像要求不大(特殊領域除外),圖像動態變化也較小,但對圖像的細節要求卻很高,同時還要保證圖像的穩定性。而這些都是採用隔行掃描1080iPAL制每秒鐘掃描50場,分別對水平方向的奇數行和偶數行進行掃描,每場的實際解析度僅有540線)所無法滿足的,因此在掃描方式上採用逐行掃描,能夠更穩定的顯示畫面的細節,使得畫面更加清晰。

在媒體流處理方面,需要將大量的原始視頻音頻數據流進行編碼壓縮後在傳輸鏈路上進行壓縮傳輸。高清晰音視頻流(720P)所處理的視頻流是傳統CIF格式流的10倍。如果採用更大解析度格式的視頻圖像,如1080P,會造成原始媒體數據流更爲巨大,從而影響視頻編碼效率,降低通訊過程的實時性,增加延遲,同時也是對圖像實時壓縮技術的考驗。因此,視頻會議系統的建設,無論是建設標清還是高清晰視頻通訊系統都要綜合考慮用戶對系統建設的投資,讓用戶付出相對較低的成本,得到最大的收益。採用過高的視頻圖像格式(1080P)進行媒體流的處理,這樣對DSP的成本會增加,同時也會相應造成用戶整體成本的增加,例如視頻會議系統的周邊配套設備——高清晰顯示設備、回放設備、存儲設備和主要的攝像採集設備,都要符合高清晰通訊的規程(高清晰視頻通訊是一個完整的端到端的系統),而這些設備的價格都遠超其他設備,會使得整體成本大幅提升,從而給用戶所能帶來的實際效果提升卻並不明顯。因此,採用720P視頻格式作爲圖像解析度的格式能夠使整體系統達到最佳的性價比,能夠有效的降低用戶的採購成本,避免投資浪費。

在圖像的幅面顯示方面,目前高清晰顯示設備均可以同時支持43169兩種顯示方式。傳統視頻通訊系統多數採用43顯示方式,而高清晰視頻通訊在視頻格式幅型比上應採用更爲符合人眼觀賞習慣的169的顯示方式來替代傳統視頻會議系統採用的4:3的顯示方式,這是因爲屏幕顯示區域在垂直解像度(線數)相同的情況下,採用169顯示方式可視面積比43顯示方式的可視面積要增加20%左右,單幀畫面可容納更多的視頻信息,這樣視頻通訊中用戶就可以獲得更大角度的視頻圖像。

所以綜述得出結論是:在對高清晰視頻通訊視頻圖像的最佳選擇應該是:選擇720P視頻格式、169幅面的高清晰視頻標準。

音頻要求:

視頻通訊過程是視頻和音頻的實時雙向完整通訊過程。在這個過程中我們爲了獲得高清晰視頻圖像,有時卻忽略了另外一個重要的過程——音頻通訊過程。如果我們在觀看高清晰視頻圖像的時候,不能得到一個更清晰、連續的音頻效果。那麼這個過程實際上就沒有任何意義,所以其重要性甚至超過視頻。在傳統的視頻會議系統中音頻技術發展極其緩慢,原因在於目前應用於視頻通訊的音頻編解碼壓縮標準都是爲了保持傳輸時的低帶寬佔用和較高的編解碼效率,從而將音頻信號的採樣頻率、採樣精度和採樣範圍指標做了極大的降低,使得所能提供的音頻清晰度和還原性都有很大程度上的衰減。與用於存儲和回放非實時壓縮協議的標準(如OGGMP3等)相比,音頻的保真度非常低。這樣就在某種程度上對現場聲音的還原達不到要求。目前傳統視頻通訊過程中主要採用的是G.711G.722G.722.1G.728等音頻標準,音頻寬度僅有50Hz7KHz單聲道,而人耳所能感知的自然界的頻響能力可以達到20Hz20KHz,因此,在對現場環境音的還原過程中過多的音頻信息的丟失造成了無法真實表現現場情況。所以在高清晰視頻通訊過程中我們勢必要有一種相輔助的音頻處理方式解決此問題。使真個高清晰通訊過程更去近於完美。

目前國際上對音頻處理技術上標準較多,在對下一代實時交互音頻處理上可以採用MPEG-1 Layer 2AAC系列音頻,對選用標準的原則是,音頻頻響範圍要達到22KHz,這樣就幾乎可以覆蓋了人耳聽覺的全部範圍,甚至在高頻方面還有所超越,能夠使現場音頻得到真實自然的還原,並且在還原時可以採用雙聲道立體聲回放,使整個視頻通訊的聲音有更強的臨近感,達到CD級音質。同時在對鏈路帶寬的適應和編解碼效率上達到最佳。下表列出AAC9種規格。

標準

  

MPEG-2 AAC MAIN

主標準,對音頻處理上,缺少增益控制

MPEG-2 AAC LC

使用了TNS,缺少增益和預測,提高編碼效率

MPEG-2AAC ***

可變取樣方式

MPEG-4 AAC LC

低複雜度編碼方式

MPEG-4 AAC MAIN

主標準

MPEG-4 AAC ***

可變取樣方式

MPEG-4 AAC LD

低延遲編碼方式

MPEG-4 AAC HE

高效率編碼方式

MPEG-4 AAC LTP

長時預測規格

綜上所述,我們在對寬頻音頻的支持上可以選擇MPEG-1 Layer 2AAC系列標準,在上述列表中可以看出有9AAC格式可供選擇,每種格式均有各自特點。在下一代高清晰視頻通訊應用領域中爲用戶提供CD級的寬頻音頻是我們追求的方向。

總結:

Anychat是一套跨平臺的即時通訊解決方案,基於先進的H.264視頻編碼標準、AAC音頻編碼標準與P2P技術,整合了佰銳科技在音視頻編碼、多媒體通訊領域領先的開發技術和豐富的產品經驗而設計的高質量、寬適應性、分佈式、模塊化的網絡音視頻互動平臺(支持WindowsMobileLinuxAndroidIOSWeb等平臺)。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章