WebRTC基於GCC的擁塞控制(上) - 算法分析

參考：https://www.jianshu.com/p/0f7ee0e0b3be

實時流媒體應用的最大特點是實時性，而延遲是實時性的最大敵人。從媒體收發端來講，媒體數據的處理速度是造成延遲的重要原因；而從傳輸角度來講，網絡擁塞則是造成延遲的最主要原因。網絡擁塞可能造成數據包丟失，也可能造成數據傳輸時間變長，延遲增大。

擁塞控制是實時流媒體應用質量保證(QoS)的重要手段之一，它在緩解網絡擁堵、減小網絡延遲、平滑數據傳輸等質量保證方面發揮重要作用。WebRTC通控制發送端數據發送碼率來達到控制網絡擁塞的目的，其採用谷歌提出的擁塞控制算法(Google Congestion Control，簡稱GCC[1])來控制發送端碼率。

本文是關於WebRTC擁塞控制算法GCC的上半部分，主要集中於對算法的理論分析，力圖對WebRTC的QoS有一個全面直觀的認識。在下半部分，將深入WebRTC源代碼內部，仔細分析GCC的實現細節。

1 GCC算法綜述

Google關於GCC的RFC文檔在文獻[1]，該RFC目前處於草案狀態，還沒有成爲IETF的正式RFC。此外，Google陸續發佈了一系列論文[2][3][4]來論述該算法的實現細節，以及其在Google Hangouts、WebRTC等產品中的應用。本文主要根據這些文檔資料，從理論上學習GCC算法。

GCC算法分兩部分：發送端基於丟包率的碼率控制和接收端基於延遲的碼率控制。如圖1所示。

圖1 GCC算法整體結構

基於丟包率的碼率控制運行在發送端，依靠RTCP RR報文進行工作。WebRTC在發送端收到來自接收端的RTCP RR報文，根據其Report Block中攜帶的丟包率信息，動態調整發送端碼率As。基於延遲的碼率控制運行在接收端，WebRTC根據數據包到達的時間延遲，通過到達時間濾波器，估算出網絡延遲m(t)，然後經過過載檢測器判斷當前網絡的擁塞狀況，最後在碼率控制器根據規則計算出遠端估計最大碼率Ar。得到Ar之後，通過RTCP REMB報文返回發送端。發送端綜合As、Ar和預配置的上下限，計算出最終的目標碼率A，該碼率會作用到Encoder、RTP和PacedSender等模塊，控制發送端的碼率。

2 發送端基於丟包率的碼率控制

GCC算法在發送端基於丟包率控制發送碼率，其基本思想是：丟包率反映網絡擁塞狀況。如果丟包率很小或者爲0，說明網絡狀況良好，在不超過預設最大碼率的情況下，可以增大發送端碼率；反之如果丟包率變大，說明網絡狀況變差，此時應減少發送端碼率。在其它情況下，發送端碼率保持不變。

GCC使用的丟包率根據接收端RTP接收統計信息計算得到，通過RTCP RR報文中返回給發送端。RTCP RR報文統計接收端RTP接收信息，如Packet Loss，Jitter，DLSR等等，如圖2所示：

圖2 RTCP RR報文結構[5]

發送端收到RTCP RR報文並解析得到丟包率後，根據圖3公式計算髮送端碼率：當丟包率大於0.1時，說明網絡發生擁塞，此時降低發送端碼率；當丟包率小於0.02時，說明網絡狀況良好，此時增大發送端碼率；其他情況下，發送端碼率保持不變。

圖3 GCC基於丟包率的碼率計算公式[4]

最終碼率會作用於Encoder、RTP和PacedSender模塊，用以在編碼器內部調整碼率和平滑發送端發送速率。

3 接收端基於延遲的碼率控制

GCC算法在接收端基於數據包到達延遲估計發送碼率Ar，然後通過RTCP REMB報文反饋到發送端，發送端把Ar作爲最終目標碼率的上限值。其基本思想是： RTP數據包的到達時間延遲m(i)反映網絡擁塞狀況。當延遲很小時，說明網絡擁塞不嚴重，可以適當增大目標碼率；當延遲變大時，說明網絡擁塞變嚴重，需要減小目標碼率；當延遲維持在一個低水平時，目標碼率維持不變。

基於延時的擁塞控制由三個主要模塊組成：到達時間濾波器，過載檢查器和速率控制器；除此之外還有過載閾值自適應模塊和REMB報文生成模塊，如圖1所示。下面分別論述其工作過程。

3.1 到達時間濾波器(Arrival-time Filter)

該模塊用以計算相鄰相鄰兩個數據包組的網絡排隊延遲m(i)。數據包組定義爲一段時間內連續發送的數據包的集合。一系列數據包短時間裏連續發送，這段時間稱爲突發時間，建議突發時間爲5ms。不建議在突發時間內的包間隔時間做度量，而是把它們做爲一組來測量。通過相鄰兩個數據包組的發送時間和到達時間，計算得到組間延遲d (i)。組間延遲示意圖及計算公式如圖4所示：

圖4 組間延遲示意圖

T(i)是第i個數據包組中第一個數據包的發送時間，t(i)是第i個數據包組中最後一個數據包的到達時間。幀間延遲通過如下公式計算得到：

d(i) = t(i) – t(i-1) – (T(i) – T(i-1))    (3.1.1)

公式1.3.1是d(i)的觀測方程。另一方面，d(i)也可由如下狀態方程得到：

d(i) = dL(i)/C(i) + w(i)                  (3.1.2)
d(i) = dL(i)/C(i) + m(i) + v(i)           (3.1.3)

其中dL(i)表示相鄰兩幀的長度差，C(i)表示網絡信道容量，m(i)表示網絡排隊延遲，v(i)表示零均值噪聲。m(i)即是我們要求得的網絡排隊延遲。通過Kalman Filter可以求得該值。具體計算過程請參考文獻[1][4][6]。

3.2 過載檢測器(Over-use Detector)

該模塊以到達時間濾波器計算得到的網絡排隊延遲m(i)爲輸入，結合當前閾值gamma_1，判斷當前網絡是否過載。判斷算法如圖5所示[2]。

圖5 過載檢測器僞代碼

算法基於當前網絡排隊延遲m(i)和當前閾值gamma_1判斷當前網絡擁塞狀況[2]：當m(i) > gamma_1時，算法計算處於當前狀態的持續時間t(ou) = t(ou) + delta(t)，如果t(ou)大於設定閾值gamma_2(實際計算中設置爲10ms)，並且m(i) > m(i-1)，則發出網絡過載信號Overuse，同時重置t(ou)。如果m(i)小於m(i-1)，即使高於閥值gamma_1也不需要發出過載信號。當m(i) < -gamma_1時，算法認爲當前網絡處於空閒狀態，發出網絡低載信號Underuse。當 – gamma_1 <= m(i) <= gamma_1是，算法認爲當前網絡使用率適中，發出保持信號Hold。算法隨着時間軸的計算過程可從圖6中看到。

圖6 時間軸上的過載檢測過程

需要注意的是，閥值gamma_1對算法的影響很大，並且閾值gamma_1是自適應性的。如果其是靜態值，會帶來一系列問題，詳見文獻[4]。所以gamma_1需要動態調整來達到良好的表現。這就是圖1中的Adaptive threshould模塊。閾值gamma_1動態更新的公式如下：

gamma_1(i) = gamma_1(i-1) + (t(i)-t(i-1)) * K(i) * (|m(i)|-gamma_1(i-1))    (3.2.4)

當|m(i)|>gamma_1(i-1)時增加gamma_1(i)，反之減小gamma_1(i)，而當|m(i)|– gamma_1(i) >15，建議gamma_1(i)不更新。K(i)爲更新系數，當|m(i)|<gamma_1(i-1)時K(i) = K_d，否則K(i) = K_u。同時建議gamma_1(i)控制在[6,600]區間。太小的值會導致探測器過於敏感。建議增加係數要大於減少係數K_u > K_d。文獻[1]給出的建議值如下：

gamma_1(0) = 12.5 ms
gamma_2  = 10 ms
K_u = 0.01
K_d = 0.00018

3.3 速率控制器(Remote Rate Controller)

該模塊以過載檢測器給出的當前網絡狀態s爲輸入，首先根據圖7所示的有限狀態機判斷當前碼率的變化趨勢，然後根據圖8所示的公式計算目標碼率Ar。

圖7 目標碼率Ar變化趨勢有限狀態機

當前網絡過載時，目標碼率處於Decrease狀態；當前網絡低載時，目標碼率處於Hold狀態；當網絡正常時，處於Decrease狀態時遷移到Hold狀態，處於Hold/Increase狀態時都遷移到Increase狀態。當判斷出碼率變化趨勢後，根據圖8所示公式進行計算目標碼率。

圖8 目標碼率Ar計算公式

當碼率變化趨勢爲Increase時，當前碼率爲上次碼率乘上係數1.05；當碼率變化趨勢爲Decrease，當前碼率爲過去500ms內的最大接收碼率乘上係數0.85。當碼率變化趨勢爲Hold時，當前碼率保持不變。目標碼率Ar計算得到之後，下一步把Ar封裝到REMB報文中發送回發送端。在REMB報文中，Ar被表示爲Ar = M * 2^Exp，其中M封裝在BR Mantissa域，佔18位；Exp封裝在BR Exp域，佔6位。REMB報文是Payload爲206的RTCP報文[7]，格式如圖9所示。

圖9 REMB報文格式

REMB報文每秒發送一次，當Ar(i) < 0.97 * Ar(i-1)時則立即發送。

3.4 發送端目標碼率的確定

發送端最終目標碼率的確定結合了基於丟包率計算得到的碼率As和基於延遲計算得到的碼率Ar。此外，在實際實現中還會配置目標碼率的上限值和下限值。綜合以上因素，最終目標碼率確定如下：

    target_bitrate = max( min( min(As, Ar), Amax), Amin)        (3.4.1)

目標碼率確定之後，分別設置到Encoder模塊和PacedSender模塊。

4 總結

本文在廣泛調研WebRTC GCC算法的相關RFC和論文的基礎上，全面深入學習GCC算法的理論分析，以此爲契機力圖對WebRTC的QoS有一個全面直觀的認識。爲將來深入WebRTC源代碼內部分析GCC的實現細節奠定基礎。

參考文獻

[1] A Google Congestion Control Algorithm for Real-Time Communication.
draft-alvestrand-rmcat-congestion-03
[2] Understanding the Dynamic Behaviour of the Google Congestion Control for RTCWeb.
[3] Experimental Investigation of the Google Congestion Control for Real-Time Flows.
[4] Analysis and Design of the Google Congestion Control for Web Real-time Communication (WebRTC). MMSys’16, May 10-13, 2016, Klagenfurt, Austria
[5] RFC3550: RTP - A Transport Protocol for Real-Time Applications
[6] WebRTC視頻接收緩衝區基於KalmanFilter的延遲模型.
http://www.jianshu.com/p/bb34995c549a
[7] RTCP message for Receiver Estimated Maximum Bitrate. draft-alvestrand-rmcat-remb-03

作者：weizhenwei
鏈接：https://www.jianshu.com/p/0f7ee0e0b3be
來源：簡書
著作權歸作者所有。商業轉載請聯繫作者獲得授權，非商業轉載請註明出處。

香菸頭

發佈了49 篇原創文章 · 獲贊 21 · 訪問量 16萬+

私信關注

WebRTC基於GCC的擁塞控制(上) - 算法分析

1 GCC算法綜述

2 發送端基於丟包率的碼率控制

3 接收端基於延遲的碼率控制

3.1 到達時間濾波器(Arrival-time Filter)

3.2 過載檢測器(Over-use Detector)

3.3 速率控制器(Remote Rate Controller)

3.4 發送端目標碼率的確定

4 總結

參考文獻

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

製作centos鏡像

httpd 403

kprobe工作原理

GPU數據傳輸概覽

工具、博客

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結