TCP擁塞控制機制

1 概述

TCP協議有兩個比較重要的控制算法，一個是流量控制，另一個就是阻塞控制。

其中，TCP協議通過滑動窗口來進行流量控制，它是控制發送方的發送速度從而使接受者來得及接收並處理；擁塞控制是作用於網絡，它是防止過多的包被髮送到網絡中，避免出現網絡負載過大，網絡擁塞的情況。

擁塞控制算法主要包括五種狀態機和四種算法：

狀態機：Open，Disorder，CWR，Recovery和Loss狀態。

算法：慢啓動，擁塞避免，擁塞發生時算法和快速恢復。

2 擁塞控制狀態機

和TCP一樣，擁塞控制算法也有其狀態機。當發送方收到一個Ack時，Linux TCP通過狀態機(state)來決定其接下來的行爲，是應該降低擁塞窗口cwnd大小，或者保持cwnd不變，還是繼續增加cwnd。如果處理不當，可能會導致丟包或者超時。

2.1 Open狀態

Open狀態是擁塞控制狀態機的默認狀態。這種狀態下，當ACK到達時，發送方根據擁塞窗口cwnd(Congestion Window)是小於還是大於慢啓動閾值ssthresh(slow start threshold)，來按照慢啓動或者擁塞避免算法來調整擁塞窗口。

2.2 Disorder狀態

當發送方檢測到DACK(重複確認)或者SACK(選擇性確認)時，狀態機將轉變爲Disorder狀態。在此狀態下，發送方遵循飛行(in-flight)包守恆原則，即一個新包只有在一個老包離開網絡後才發送，也就是發送方收到老包的ACK後，纔會再發送一個新包。

2.3 CWR狀態

發送方接收到一個擁塞通知時，並不會立刻減少擁塞窗口cwnd，而是每收到兩個ACK就減少一個段，直到窗口的大小減半爲止。當cwnd正在減小並且網絡中有沒有重傳包時，這個狀態就叫CWR(Congestion Window Reduced，擁塞窗口減少)狀態。CWR狀態可以轉變成Recovery或者Loss狀態。

2.4 Recovery狀態

當發送方接收到足夠(推薦爲三個)的DACK(重複確認)後，進入該狀態。在該狀態下，擁塞窗口cnwd每收到兩個ACK就減少一個段(segment)，直到cwnd等於慢啓動閾值ssthresh，也就是剛進入Recover狀態時cwnd的一半大小。
發送方保持 Recovery 狀態直到所有進入 Recovery狀態時正在發送的數據段都成功地被確認，然後發送方恢復成Open狀態，重傳超時有可能中斷 Recovery 狀態，進入Loss狀態。

2.5 Loss狀態

當一個RTO(重傳超時時間)到期後，發送方進入Loss狀態。所有正在發送的數據標記爲丟失，擁塞窗口cwnd設置爲一個段(segment)，發送方再次以慢啓動算法增大擁塞窗口cwnd。

Loss 和 Recovery 狀態的區別是:Loss狀態下，擁塞窗口在發送方設置爲一個段後增大，而 Recovery 狀態下，擁塞窗口只能被減小。Loss 狀態不能被其他的狀態中斷，因此，發送方只有在所有 Loss 開始時正在傳輸的數據都得到成功確認後，才能退到 Open 狀態。

3 四大算法

擁塞控制主要是四個算法：1）慢啓動，2）擁塞避免，3）擁塞發生，4）快速恢復。這四個算法不是一天都搞出來的，這個四算法的發展經歷了很多時間，到今天都還在優化中。

3.1 慢熱啓動算法 – Slow Start

所謂慢啓動，也就是TCP連接剛建立，一點一點地提速，試探一下網絡的承受能力，以免直接擾亂了網絡通道的秩序。

慢啓動算法：

1) 連接建好的開始先初始化擁塞窗口cwnd大小爲1，表明可以傳一個MSS大小的數據。
2) 每當收到一個ACK，cwnd大小加一，呈線性上升。
3) 每當過了一個往返延遲時間RTT(Round-Trip Time)，cwnd大小直接翻倍，乘以2，呈指數讓升。
4) 還有一個ssthresh（slow start threshold），是一個上限，當cwnd >= ssthresh時，就會進入“擁塞避免算法”（後面會說這個算法）

3.2 擁塞避免算法 – Congestion Avoidance

如同前邊說的，當擁塞窗口大小cwnd大於等於慢啓動閾值ssthresh後，就進入擁塞避免算法。算法如下：

1) 收到一個ACK，則cwnd = cwnd + 1 / cwnd
2) 每當過了一個往返延遲時間RTT，cwnd大小加一。

過了慢啓動閾值後，擁塞避免算法可以避免窗口增長過快導致窗口擁塞，而是緩慢的增加調整到網絡的最佳值。

3.3 擁塞狀態時的算法

一般來說，TCP擁塞控制默認認爲網絡丟包是由於網絡擁塞導致的，所以一般的TCP擁塞控制算法以丟包爲網絡進入擁塞狀態的信號。對於丟包有兩種判定方式，一種是超時重傳RTO[Retransmission Timeout]超時，另一個是收到三個重複確認ACK。

超時重傳是TCP協議保證數據可靠性的一個重要機制，其原理是在發送一個數據以後就開啓一個計時器，在一定時間內如果沒有得到發送數據報的ACK報文，那麼就重新發送數據，直到發送成功爲止。

但是如果發送端接收到3個以上的重複ACK，TCP就意識到數據發生丟失，需要重傳。這個機制不需要等到重傳定時器超時，所以叫
做快速重傳，而快速重傳後沒有使用慢啓動算法，而是擁塞避免算法，所以這又叫做快速恢復算法。

超時重傳RTO[Retransmission Timeout]超時，TCP會重傳數據包。TCP認爲這種情況比較糟糕，反應也比較強烈：

由於發生丟包，將慢啓動閾值ssthresh設置爲當前cwnd的一半，即ssthresh = cwnd / 2.
cwnd重置爲1
進入慢啓動過程

最爲早期的TCP Tahoe算法就只使用上述處理辦法，但是由於一丟包就一切重來，導致cwnd又重置爲1，十分不利於網絡數據的穩定傳遞。

所以，TCP Reno算法進行了優化。當收到三個重複確認ACK時，TCP開啓快速重傳Fast Retransmit算法，而不用等到RTO超時再進行重傳：

cwnd大小縮小爲當前的一半
ssthresh設置爲縮小後的cwnd大小
然後進入快速恢復算法Fast Recovery。

3.4 快速恢復算法 – Fast Recovery

TCP Tahoe是早期的算法，所以沒有快速恢復算法，而Reno算法有。在進入快速恢復之前，cwnd和ssthresh已經被更改爲原有cwnd的一半。快速恢復算法的邏輯如下：

cwnd = cwnd + 3 MSS，加3 MSS的原因是因爲收到3個重複的ACK。
重傳DACKs指定的數據包。
如果再收到DACKs，那麼cwnd大小增加一。
如果收到新的ACK，表明重傳的包成功了，那麼退出快速恢復算法。將cwnd設置爲ssthresh，然後進入擁塞避免算法。

如圖所示，第五個包發生了丟失，所以導致接收方接收到三次重複ACK，也就是ACK5。所以將ssthresh設置噹噹時cwnd的一半，也就是6/2 = 3，cwnd設置爲3 + 3 = 6。然後重傳第五個包。當收到新的ACK時，也就是ACK11，則退出快速恢復階段，將cwnd重新設置爲當前的ssthresh，也就是3，然後進入擁塞避免算法階段。

TCP擁塞控制機制

1 概述

2 擁塞控制狀態機

2.1 Open狀態

2.2 Disorder狀態

2.3 CWR狀態

2.4 Recovery狀態

2.5 Loss狀態

3 四大算法

3.1 慢熱啓動算法 – Slow Start

3.2 擁塞避免算法 – Congestion Avoidance

3.3 擁塞狀態時的算法

3.4 快速恢復算法 – Fast Recovery

MySQL之索引

Thrift框架(一)：安裝與編寫c++ demo

網絡粘包解包問題雜談

Redis教程：事件、客戶端和服務器

網絡協議收發數據問題

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結