優化Linux下的內核TCP參數來提高服務器負載能力

提高服務器的負載能力,是一個永恆的話題。在一臺服務器CPU和內存資源額定有限的情況下,最大的壓榨服務器的性能,是最終的目的。要提高Linux系統下的負載能力,可以先啓用Apache的Worker模式,來提高單位時間內的併發量。但是即使這麼做了,當網站發展起來之後,連接數過多的問題就會日益明顯。在節省成本的情況下,可以考慮修改Linux的內核TCP/IP參數,來最大的壓榨服務器的性能。當然,如果通過修改內核參數也無法解決的負載問題,也只能考慮升級服務器了,這是硬件所限,沒有辦法的事。

Linux系統下,TCP/IP連接斷開後,會以TIME_WAIT狀態保留一定的時間,然後纔會釋放端口。當併發請求過多的時候,就會產生大量的TIME_WAIT狀態的連接,無法及時斷開的話,會佔用大量的端口資源和服務器資源(因爲關閉後進程纔會退出)。這個時候我們可以考慮優化TCP/IP的內核參數,來及時將TIME_WAIT狀態的端口清理掉。

本文介紹的方法只對擁有大量TIME_WAIT狀態的連接導致系統資源消耗有效,不是這個原因的情況下,效果可能不明顯。那麼,到哪兒去查TIME_WAIT狀態的連接呢?那就是使用netstat命令。我們可以輸入一個複覈命令,去查看當前TCP/IP連接的狀態和對應的個數:

#netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

這個命令會顯示出類似下面的結果:

LAST_ACK 14
SYN_RECV 348
ESTABLISHED 70
FIN_WAIT1 229
FIN_WAIT2 30
CLOSING 33
TIME_WAIT 18122

我們只用關心TIME_WAIT的個數,在這裏可以看到,有18000多個TIME_WAIT,這樣就佔用了18000多個端口。要知道端口的數量只有65535個,佔用一個少一個,會嚴重的影響到後繼的新連接。這種情況下,我們就有必要調整下Linux的TCP/IP內核參數,讓系統更快的釋放TIME_WAIT連接。

我們用vim打開配置文件:

#vim /etc/sysctl.conf

然後,在這個文件中,加入下面的幾行內容:

net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 30

最後輸入下面的命令,讓內核參數生效:

#/sbin/sysctl -p

簡單的說明下,上面的參數的含義:

net.ipv4.tcp_syncookies = 1 表示開啓SYN Cookies。當出現SYN等待隊列溢出時,啓用cookies來處理,可防範少量SYN***,默認爲0,表示關閉;
net.ipv4.tcp_tw_reuse = 1 表示開啓重用。允許將TIME-WAIT sockets重新用於新的TCP連接,默認爲0,表示關閉;
net.ipv4.tcp_tw_recycle = 1 表示開啓TCP連接中TIME-WAIT sockets的快速回收,默認爲0,表示關閉;
net.ipv4.tcp_fin_timeout 修改系統默認的 TIMEOUT 時間。

在經過這樣的調整之後,除了會進一步提升服務器的負載能力之外,還能夠防禦一定程度的DDoS、CC和SYN***,是個一舉兩得的做法。

此外,如果你的連接數本身就很多,我們可以再優化一下TCP/IP的可使用端口範圍,進一步提升服務器的併發能力。依然是往上面的參數文件中,加入下面這些配置:

net.ipv4.tcp_keepalive_time = 1200
net.ipv4.ip_local_port_range = 10000 65000
net.ipv4.tcp_max_syn_backlog = 8192
net.ipv4.tcp_max_tw_buckets = 5000

這幾個參數,建議只在流量非常大的服務器上開啓,會有顯著的效果。一般的流量小的服務器上,沒有必要去設置這幾個參數。這幾個參數的含義如下:

net.ipv4.tcp_keepalive_time = 1200 表示當keepalive起用的時候,TCP發送keepalive消息的頻度。缺省是2小時,改爲20分鐘。
net.ipv4.ip_local_port_range = 10000 65000 表示用於向外連接的端口範圍。缺省情況下很小:32768到61000,改爲10000到65000。(注意:這裏不要將最低值設的太低,否則可能會佔用掉正常的端口!
net.ipv4.tcp_max_syn_backlog = 8192 表示SYN隊列的長度,默認爲1024,加大隊列長度爲8192,可以容納更多等待連接的網絡連接數。
net.ipv4.tcp_max_tw_buckets = 5000 表示系統同時保持TIME_WAIT的最大數量,如果超過這個數字,TIME_WAIT將立刻被清除並打印警告信息。默 認爲180000,改爲5000。對於Apache、Nginx等服務器,上幾行的參數可以很好地減少TIME_WAIT套接字數量,但是對於 Squid,效果卻不大。此項參數可以控制TIME_WAIT的最大數量,避免Squid服務器被大量的TIME_WAIT拖死。

經過這樣的配置之後,你的服務器的TCP/IP併發能力又會上一個新臺階


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章