負載均衡(一)——初始負載均衡

最近在看的幾本書中都提到負載均衡技術,發現自己對這部分內容瞭解的並不是很多,所以把這塊知識補充一下。與君共勉~!

什麼是負載均衡(Load balancing)

在網站創立初期,我們一般都使用單臺機器對臺提供集中式服務,但是隨着業務量越來越大,無論是性能上還是穩定性上都有了更大的挑戰。這時候我們就會想到通過擴容的方式來提供更好的服務。我們一般會把多臺機器組成一個集羣對外提供服務。然而,我們的網站對外提供的訪問入口都是一個的,比如www.taobao.com。那麼當用戶在瀏覽器輸入www.taobao.com的時候如何將用戶的請求分發到集羣中不同的機器上呢,這就是負載均衡在做的事情。

負載均衡分類

現在我們知道,負載均衡就是一種計算機網絡技術,用來在多個計算機(計算機集羣)、網絡連接、CPU、磁碟驅動器或其他資源中分配負載,以達到最佳化資源使用、最大化吞吐率、最小化響應時間、同時避免過載的目的。那麼,這種計算機技術的實現方式有多種。大致可以分爲以下幾種,其中最常用的是四層和七層負載均衡:

  • 二層負載均衡

負載均衡服務器對外依然提供一個VIP(虛IP),集羣中不同的機器採用相同IP地址,但是機器的MAC地址不一樣。當負載均衡服務器接受到請求之後,通過改寫報文的目標MAC地址的方式將請求轉發到目標機器實現負載均衡。

  • 三層負載均衡

和二層負載均衡類似,負載均衡服務器對外依然提供一個VIP(虛IP),但是集羣中不同的機器採用不同的IP地址。當負載均衡服務器接受到請求之後,根據不同的負載均衡算法,通過IP將請求轉發至不同的真實服務器。

  • 四層負載均衡

四層負載均衡工作在OSI模型的傳輸層,由於在傳輸層,只有TCP/UDP協議,這兩種協議中除了包含源IP、目標IP以外,還包含源端口號及目的端口號。四層負載均衡服務器在接受到客戶端請求後,以後通過修改數據包的地址信息(IP+端口號)將流量轉發到應用服務器。

  • 七層負載均衡

七層負載均衡工作在OSI模型的應用層,應用層協議較多,常用http、radius、dns等。七層負載就可以基於這些協議來負載。這些應用層協議中會包含很多有意義的內容。比如同一個Web服務器的負載均衡,除了根據IP加端口進行負載外,還可根據七層的URL、瀏覽器類別、語言來決定是否要進行負載均衡。

圖,四層和七層負載均衡

對於一般的應用來說,有了Nginx就夠了。Nginx可以用於七層負載均衡。但是對於一些大的網站,一般會採用DNS+四層負載+七層負載的方式進行多層次負載均衡。

圖,阿里雲的SLB

常用負載均衡工具

Nginx/LVS/HAProxy是目前使用最廣泛的三種負載均衡軟件。

LVS

LVS(Linux Virtual Server),也就是Linux虛擬服務器, 是一個由章文嵩博士發起的自由軟件項目。使用LVS技術要達到的目標是:通過LVS提供的負載均衡技術和Linux操作系統實現一個高性能、高可用的服務器羣集,它具有良好可靠性、可擴展性和可操作性。從而以低廉的成本實現最優的服務性能。

LVS主要用來做四層負載均衡。

Nginx

Nginx(發音同engine x)是一個網頁服務器,它能反向代理HTTP, HTTPS, SMTP, POP3, IMAP的協議鏈接,以及一個負載均衡器和一個HTTP緩存。

Nginx主要用來做七層負載均衡。

HAProxy

HAProxy是一個使用C語言編寫的自由及開放源代碼軟件,其提供高可用性、負載均衡,以及基於TCP和HTTP的應用程序代理。

Haproxy主要用來做七層負載均衡。

常見負載均衡算法

上面介紹負載均衡技術的時候提到過,負載均衡服務器在決定將請求轉發到具體哪臺真實服務器的時候,是通過負載均衡算法來實現的。負載均衡算法可以分爲兩類:靜態負載均衡算法和動態負載均衡算法。

靜態負載均衡算法包括:輪詢,比率,優先權

動態負載均衡算法包括: 最少連接數,最快響應速度,觀察方法,預測法,動態性能分配,動態服務器補充,服務質量,服務類型,規則模式。

  • 輪詢(Round Robin):順序循環將請求一次順序循環地連接每個服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP 就把其從順序循環隊列中拿出,不參加下一次的輪詢,直到其恢復正常。

  • 比率(Ratio):給每個服務器分配一個加權值爲比例,根椐這個比例,把用戶的請求分配到每個服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP 就把其從服務器隊列中拿出,不參加下一次的用戶請求的分配, 直到其恢復正常。

  • 優先權(Priority):給所有服務器分組,給每個組定義優先權,BIG-IP 用戶的請求,分配給優先級最高的服務器組(在同一組內,採用輪詢或比率算法,分配用戶的請求);當最高優先級中所有服務器出現故障,BIG-IP 纔將請求送給次優先級的服務器組。這種方式,實際爲用戶提供一種熱備份的方式。

  • 最少的連接方式(Least Connection):傳遞新的連接給那些進行最少連接處理的服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP 就把其從服務器隊列中拿出,不參加下一次的用戶請求的分配, 直到其恢復正常。

  • 最快模式(Fastest):傳遞連接給那些響應最快的服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP 就把其從服務器隊列中拿出,不參加下一次的用戶請求的分配,直到其恢復正常。

  • 觀察模式(Observed):連接數目和響應時間以這兩項的最佳平衡爲依據爲新的請求選擇服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP就把其從服務器隊列中拿出,不參加下一次的用戶請求的分配,直到其恢復正常。

  • 預測模式(Predictive):BIG-IP利用收集到的服務器當前的性能指標,進行預測分析,選擇一臺服務器在下一個時間片內,其性能將達到最佳的服務器相應用戶的請求。(被BIG-IP 進行檢測)

  • 動態性能分配(Dynamic Ratio-APM):BIG-IP 收集到的應用程序和應用服務器的各項性能參數,動態調整流量分配。 動態服務器補充(Dynamic Server Act.):當主服務器羣中因故障導致數量減少時,動態地將備份服務器補充至主服務器羣。

  • 服務質量(QoS):按不同的優先級對數據流進行分配。

  • 服務類型(ToS): 按不同的服務類型(在Type of Field中標識)負載均衡對數據流進行分配。

  • 規則模式:針對不同的數據流設置導向規則,用戶可自行。

【本文是51CTO專欄作者Hollis的原創文章,作者微信公衆號Hollis(ID:hollischuang)】


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章