TCP擁塞控制機制

目錄

1 概述

2 擁塞控制狀態機

2.1 Open狀態

2.2 Disorder狀態

2.3 CWR狀態

2.4 Recovery狀態

2.5 Loss狀態

3 四大算法

3.1 慢熱啓動算法 – Slow Start

3.2 擁塞避免算法 – Congestion Avoidance

3.3 擁塞狀態時的算法

3.4  快速恢復算法 – Fast Recovery


1 概述

    TCP協議有兩個比較重要的控制算法,一個是流量控制,另一個就是阻塞控制

       其中,TCP協議通過滑動窗口來進行流量控制,它是控制發送方的發送速度從而使接受者來得及接收並處理;擁塞控制是作用於網絡,它是防止過多的包被髮送到網絡中,避免出現網絡負載過大,網絡擁塞的情況。

擁塞控制算法主要包括五種狀態機和四種算法:

狀態機:Open,Disorder,CWR,Recovery和Loss狀態。

算法:慢啓動,擁塞避免,擁塞發生時算法和快速恢復。

2 擁塞控制狀態機

       和TCP一樣,擁塞控制算法也有其狀態機。當發送方收到一個Ack時,Linux TCP通過狀態機(state)來決定其接下來的行爲,是應該降低擁塞窗口cwnd大小,或者保持cwnd不變,還是繼續增加cwnd。如果處理不當,可能會導致丟包或者超時。

圖2-1 TCP擁塞控制狀態機

2.1 Open狀態

       Open狀態是擁塞控制狀態機的默認狀態。這種狀態下,當ACK到達時,發送方根據擁塞窗口cwnd(Congestion Window)是小於還是大於慢啓動閾值ssthresh(slow start threshold),來按照慢啓動或者擁塞避免算法來調整擁塞窗口。

2.2 Disorder狀態

      當發送方檢測到DACK(重複確認)或者SACK(選擇性確認)時,狀態機將轉變爲Disorder狀態。在此狀態下,發送方遵循飛行(in-flight)包守恆原則,即一個新包只有在一個老包離開網絡後才發送,也就是發送方收到老包的ACK後,纔會再發送一個新包。 

2.3 CWR狀態

       發送方接收到一個擁塞通知時,並不會立刻減少擁塞窗口cwnd,而是每收到兩個ACK就減少一個段,直到窗口的大小減半爲止。當cwnd正在減小並且網絡中有沒有重傳包時,這個狀態就叫CWR(Congestion Window Reduced,擁塞窗口減少)狀態。CWR狀態可以轉變成Recovery或者Loss狀態。

2.4 Recovery狀態

       當發送方接收到足夠(推薦爲三個)的DACK(重複確認)後,進入該狀態。在該狀態下,擁塞窗口cnwd每收到兩個ACK就減少一個段(segment),直到cwnd等於慢啓動閾值ssthresh,也就是剛進入Recover狀態時cwnd的一半大小
    發送方保持 Recovery 狀態直到所有進入 Recovery狀態時正在發送的數據段都成功地被確認,然後發送方恢復成Open狀態,重傳超時有可能中斷 Recovery 狀態,進入Loss狀態。

2.5 Loss狀態

      當一個RTO(重傳超時時間)到期後,發送方進入Loss狀態。所有正在發送的數據標記爲丟失,擁塞窗口cwnd設置爲一個段(segment),發送方再次以慢啓動算法增大擁塞窗口cwnd。

    Loss 和 Recovery 狀態的區別是:Loss狀態下,擁塞窗口在發送方設置爲一個段後增大,而 Recovery 狀態下,擁塞窗口只能被減小。Loss 狀態不能被其他的狀態中斷,因此,發送方只有在所有 Loss 開始時正在傳輸的數據都得到成功確認後,才能退到 Open 狀態。

3 四大算法

       擁塞控制主要是四個算法:1)慢啓動,2)擁塞避免,3)擁塞發生,4)快速恢復。這四個算法不是一天都搞出來的,這個四算法的發展經歷了很多時間,到今天都還在優化中。

圖3-1 擁塞控制狀態轉移圖

3.1 慢熱啓動算法 – Slow Start

       所謂慢啓動,也就是TCP連接剛建立,一點一點地提速,試探一下網絡的承受能力,以免直接擾亂了網絡通道的秩序。

慢啓動算法:

1) 連接建好的開始先初始化擁塞窗口cwnd大小爲1,表明可以傳一個MSS大小的數據。
2) 每當收到一個ACK,cwnd大小加一,呈線性上升。
3) 每當過了一個往返延遲時間RTT(Round-Trip Time),cwnd大小直接翻倍,乘以2,呈指數讓升。
4) 還有一個ssthresh(slow start threshold),是一個上限,當cwnd >= ssthresh時,就會進入“擁塞避免算法”(後面會說這個算法)

3.2 擁塞避免算法 – Congestion Avoidance

如同前邊說的,當擁塞窗口大小cwnd大於等於慢啓動閾值ssthresh後,就進入擁塞避免算法。算法如下:

1) 收到一個ACK,則cwnd = cwnd + 1 / cwnd
2) 每當過了一個往返延遲時間RTT,cwnd大小加一。

 過了慢啓動閾值後,擁塞避免算法可以避免窗口增長過快導致窗口擁塞,而是緩慢的增加調整到網絡的最佳值。

3.3 擁塞狀態時的算法

       一般來說,TCP擁塞控制默認認爲網絡丟包是由於網絡擁塞導致的,所以一般的TCP擁塞控制算法以丟包爲網絡進入擁塞狀態的信號。對於丟包有兩種判定方式,一種是超時重傳RTO[Retransmission Timeout]超時,另一個是收到三個重複確認ACK。

 超時重傳是TCP協議保證數據可靠性的一個重要機制,其原理是在發送一個數據以後就開啓一個計時器,在一定時間內如果沒有得到發送數據報的ACK報文,那麼就重新發送數據,直到發送成功爲止。

 但是如果發送端接收到3個以上的重複ACK,TCP就意識到數據發生丟失,需要重傳。這個機制不需要等到重傳定時器超時,所以叫
做快速重傳,而快速重傳後沒有使用慢啓動算法,而是擁塞避免算法,所以這又叫做快速恢復算法。

 超時重傳RTO[Retransmission Timeout]超時,TCP會重傳數據包。TCP認爲這種情況比較糟糕,反應也比較強烈:

  • 由於發生丟包,將慢啓動閾值ssthresh設置爲當前cwnd的一半,即ssthresh = cwnd / 2.
  • cwnd重置爲1
  • 進入慢啓動過程

 最爲早期的TCP Tahoe算法就只使用上述處理辦法,但是由於一丟包就一切重來,導致cwnd又重置爲1,十分不利於網絡數據的穩定傳遞。

 所以,TCP Reno算法進行了優化。當收到三個重複確認ACK時,TCP開啓快速重傳Fast Retransmit算法,而不用等到RTO超時再進行重傳:

  • cwnd大小縮小爲當前的一半
  • ssthresh設置爲縮小後的cwnd大小
  • 然後進入快速恢復算法Fast Recovery。
圖3-2 擁塞窗口圖

3.4  快速恢復算法 – Fast Recovery

      TCP Tahoe是早期的算法,所以沒有快速恢復算法,而Reno算法有。在進入快速恢復之前,cwnd和ssthresh已經被更改爲原有cwnd的一半。快速恢復算法的邏輯如下:

  • cwnd = cwnd + 3 MSS,加3 MSS的原因是因爲收到3個重複的ACK。
  • 重傳DACKs指定的數據包。
  • 如果再收到DACKs,那麼cwnd大小增加一。
  • 如果收到新的ACK,表明重傳的包成功了,那麼退出快速恢復算法。將cwnd設置爲ssthresh,然後進入擁塞避免算法。
圖3-3 數據收發圖

       如圖所示,第五個包發生了丟失,所以導致接收方接收到三次重複ACK,也就是ACK5。所以將ssthresh設置噹噹時cwnd的一半,也就是6/2 = 3,cwnd設置爲3 + 3 = 6。然後重傳第五個包。當收到新的ACK時,也就是ACK11,則退出快速恢復階段,將cwnd重新設置爲當前的ssthresh,也就是3,然後進入擁塞避免算法階段。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章