負載均衡技術全攻略

負載均衡技術全攻略
Internet的規模每一百天就會增長一倍，客戶希望獲得7天24小時的不間斷可用性及較快的系統反應時間，而不願屢次看到某個站點“Server Too Busy”及頻繁的系統故障。
　　網絡的各個核心部分隨着業務量的提高、訪問量和數據流量的快速增長，其處理能力和計算強度也相應增大，使得單一設備根本無法承擔。在此情況下，如果扔掉現有設備去做大量的硬件升級，這樣將造成現有資源的浪費，而且如果再面臨下一次業務量的提升，這又將導致再一次硬件升級的高額成本投入，甚至性能再卓越的設備也不能滿足當前業務量的需求。於是，負載均衡機制應運而生。
　　負載均衡（Load Balance）建立在現有網絡結構之上，它提供了一種廉價有效透明的方法擴展網絡設備和服務器的帶寬、增加吞吐量、加強網絡數據處理能力、提高網絡的靈活性和可用性。
　　負載均衡有兩方面的含義：首先，大量的併發訪問或數據流量分擔到多臺節點設備上分別處理，減少用戶等待響應的時間；其次，單個重負載的運算分擔到多臺節點設備上做並行處理，每個節點設備處理結束後，將結果彙總，返回給用戶，系統處理能力得到大幅度提高。
　　本文所要介紹的負載均衡技術主要是指在均衡服務器羣中所有服務器和應用程序之間流量負載的應用，目前負載均衡技術大多數是用於提高諸如在Web服務器、FTP服務器和其它關鍵任務服務器上的Internet服務器程序的可用性和可伸縮性。
負載均衡技術分類
　　目前有許多不同的負載均衡技術用以滿足不同的應用需求，下面從負載均衡所採用的設備對象、應用的網絡層次（指OSI參考模型）及應用的地理結構等來分類。
軟/硬件負載均衡
軟件負載均衡解決方案是指在一臺或多臺服務器相應的操作系統上安裝一個或多個附加軟件來實現負載均衡，如DNS Load Balance，CheckPoint Firewall-1 ConnectControl等，它的優點是基於特定環境，配置簡單，使用靈活，成本低廉，可以滿足一般的負載均衡需求。
　　軟件解決方案缺點也較多，因爲每臺服務器上安裝額外的軟件運行會消耗系統不定量的資源，越是功能強大的模塊，消耗得越多，所以當連接請求特別大的時候，軟件本身會成爲服務器工作成敗的一個關鍵；軟件可擴展性並不是很好，受到操作系統的限制；由於操作系統本身的Bug，往往會引起安全問題。
　　硬件負載均衡解決方案是直接在服務器和外部網絡間安裝負載均衡設備，這種設備我們通常稱之爲負載均衡器，由於專門的設備完成專門的任務，獨立於操作系統，整體性能得到大量提高，加上多樣化的負載均衡策略，智能化的流量管理，可達到最佳的負載均衡需求。
　　負載均衡器有多種多樣的形式，除了作爲獨立意義上的負載均衡器外，有些負載均衡器集成在交換設備中，置於服務器與Internet鏈接之間，有些則以兩塊網絡適配器將這一功能集成到PC中，一塊連接到Internet上，一塊連接到後端服務器羣的內部網絡上。
　　一般而言，硬件負載均衡在功能、性能上優於軟件方式，不過成本昂貴。
本地/全局負載均衡
負載均衡從其應用的地理結構上分爲本地負載均衡(Local Load Balance)和全局負載均衡(Global Load Balance，也叫地域負載均衡)，本地負載均衡是指對本地的服務器羣做負載均衡，全局負載均衡是指對分別放置在不同的地理位置、有不同網絡結構的服務器羣間作負載均衡。
　　本地負載均衡能有效地解決數據流量過大、網絡負荷過重的問題，並且不需花費昂貴開支購置性能卓越的服務器，充分利用現有設備，避免服務器單點故障造成數據流量的損失。其有靈活多樣的均衡策略把數據流量合理地分配給服務器羣內的服務器共同負擔。即使是再給現有服務器擴充升級，也只是簡單地增加一個新的服務器到服務羣中，而不需改變現有網絡結構、停止現有的服務。
　　全局負載均衡主要用於在一個多區域擁有自己服務器的站點，爲了使全球用戶只以一個IP地址或域名就能訪問到離自己最近的服務器，從而獲得最快的訪問速度，也可用於子公司分散站點分佈廣的大公司通過Intranet（企業內部互聯網）來達到資源統一合理分配的目的。
　　全局負載均衡有以下的特點：
實現地理位置無關性，能夠遠距離爲用戶提供完全的透明服務。
除了能避免服務器、數據中心等的單點失效，也能避免由於ISP專線故障引起的單點失效。
解決網絡擁塞問題，提高服務器響應速度，服務就近提供，達到更好的訪問質量。
網絡層次上的負載均衡
針對網絡上負載過重的不同瓶頸所在，從網絡的不同層次入手，我們可以採用相應的負載均衡技術來解決現有問題。
　　隨着帶寬增加，數據流量不斷增大，網絡核心部分的數據接口將面臨瓶頸問題，原有的單一線路將很難滿足需求，而且線路的升級又過於昂貴甚至難以實現，這時就可以考慮採用鏈路聚合（Trunking）技術。
　　鏈路聚合技術（第二層負載均衡）將多條物理鏈路當作一條單一的聚合邏輯鏈路使用，網絡數據流量由聚合邏輯鏈路中所有物理鏈路共同承擔，由此在邏輯上增大了鏈路的容量，使其能滿足帶寬增加的需求。
　　現代負載均衡技術通常操作於網絡的第四層或第七層。第四層負載均衡將一個Internet上合法註冊的IP地址映射爲多個內部服務器的IP地址，對每次 TCP連接請求動態使用其中一個內部IP地址，達到負載均衡的目的。在第四層交換機中，此種均衡技術得到廣泛的應用，一個目標地址是服務器羣VIP（虛擬 IP，Virtual IP address）連接請求的數據包流經交換機，交換機根據源端和目的IP地址、TCP或UDP端口號和一定的負載均衡策略，在服務器IP和VIP間進行映射，選取服務器羣中最好的服務器來處理連接請求。
　　第七層負載均衡控制應用層服務的內容，提供了一種對訪問流量的高層控制方式，適合對HTTP服務器羣的應用。第七層負載均衡技術通過檢查流經的HTTP報頭，根據報頭內的信息來執行負載均衡任務。
　　第七層負載均衡優點表現在如下幾個方面：
通過對HTTP報頭的檢查，可以檢測出HTTP400、500和600系列的錯誤信息，因而能透明地將連接請求重新定向到另一臺服務器，避免應用層故障。
可根據流經的數據類型（如判斷數據包是圖像文件、壓縮文件或多媒體文件格式等），把數據流量引向相應內容的服務器來處理，增加系統性能。
能根據連接請求的類型，如是普通文本、圖象等靜態文檔請求，還是asp、cgi等的動態文檔請求，把相應的請求引向相應的服務器來處理，提高系統的性能及安全性。
第七層負載均衡受到其所支持的協議限制（一般只有HTTP），這樣就限制了它應用的廣泛性，並且檢查HTTP報頭會佔用大量的系統資源，勢必會影響到系統的性能，在大量連接請求的情況下，負載均衡設備自身容易成爲網絡整體性能的瓶頸。
負載均衡策略
　　在實際應用中，我們可能不想僅僅是把客戶端的服務請求平均地分配給內部服務器，而不管服務器是否宕機。而是想使Pentium III服務器比Pentium II能接受更多的服務請求，一臺處理服務請求較少的服務器能分配到更多的服務請求，出現故障的服務器將不再接受服務請求直至故障恢復等等。
　　選擇合適的負載均衡策略，使多個設備能很好的共同完成任務，消除或避免現有網絡負載分佈不均、數據流量擁擠反應時間長的瓶頸。在各負載均衡方式中，針對不同的應用需求，在OSI參考模型的第二、三、四、七層的負載均衡都有相應的負載均衡策略。
　　負載均衡策略的優劣及其實現的難易程度有兩個關鍵因素：一、負載均衡算法，二、對網絡系統狀況的檢測方式和能力。
　　考慮到服務請求的不同類型、服務器的不同處理能力以及隨機選擇造成的負載分配不均勻等問題，爲了更加合理的把負載分配給內部的多個服務器，就需要應用相應的能夠正確反映各個服務器處理能力及網絡狀態的負載均衡算法：
輪循均衡（Round Robin）：每一次來自網絡的請求輪流分配給內部中的服務器，從1至N然後重新開始。此種均衡算法適合於服務器組中的所有服務器都有相同的軟硬件配置並且平均服務請求相對均衡的情況。

權重輪循均衡（Weighted Round Robin）：根據服務器的不同處理能力，給每個服務器分配不同的權值，使其能夠接受相應權值數的服務請求。例如：服務器A的權值被設計成1，B的權值是 3，C的權值是6，則服務器A、B、C將分別接受到10%、30％、60％的服務請求。此種均衡算法能確保高性能的服務器得到更多的使用率，避免低性能的服務器負載過重。

隨機均衡（Random）：把來自網絡的請求隨機分配給內部中的多個服務器。

權重隨機均衡（Weighted Random）：此種均衡算法類似於權重輪循算法，不過在處理請求分擔時是個隨機選擇的過程。

響應速度均衡（Response Time）：負載均衡設備對內部各服務器發出一個探測請求（例如Ping），然後根據內部中各服務器對探測請求的最快響應時間來決定哪一臺服務器來響應客戶端的服務請求。此種均衡算法能較好的反映服務器的當前運行狀態，但這最快響應時間僅僅指的是負載均衡設備與服務器間的最快響應時間，而不是客戶端與服務器間的最快響應時間。

最少連接數均衡（Least Connection）：客戶端的每一次請求服務在服務器停留的時間可能會有較大的差異，隨着工作時間加長，如果採用簡單的輪循或隨機均衡算法，每一臺服務器上的連接進程可能會產生極大的不同，並沒有達到真正的負載均衡。最少連接數均衡算法對內部中需負載的每一臺服務器都有一個數據記錄，記錄當前該服務器正在處理的連接數量，當有新的服務連接請求時，將把當前請求分配給連接數最少的服務器，使均衡更加符合實際情況，負載更加均衡。此種均衡算法適合長時處理的請求服務，如FTP。

處理能力均衡：此種均衡算法將把服務請求分配給內部中處理負荷（根據服務器CPU型號、CPU數量、內存大小及當前連接數等換算而成）最輕的服務器，由於考慮到了內部服務器的處理能力及當前網絡運行狀況，所以此種均衡算法相對來說更加精確，尤其適合運用到第七層（應用層）負載均衡的情況下。

DNS響應均衡（Flash DNS）：在Internet上，無論是HTTP、FTP或是其它的服務請求，客戶端一般都是通過域名解析來找到服務器確切的IP地址的。在此均衡算法下，分處在不同地理位置的負載均衡設備收到同一個客戶端的域名解析請求，並在同一時間內把此域名解析成各自相對應服務器的IP地址（即與此負載均衡設備在同一位地理位置的服務器的IP地址）並返回給客戶端，則客戶端將以最先收到的域名解析IP地址來繼續請求服務，而忽略其它的IP地址響應。在種均衡策略適合應用在全局負載均衡的情況下，對本地負載均衡是沒有意義的。
儘管有多種的負載均衡算法可以較好的把數據流量分配給服務器去負載，但如果負載均衡策略沒有對網絡系統狀況的檢測方式和能力，一旦在某臺服務器或某段負載均衡設備與服務器網絡間出現故障的情況下，負載均衡設備依然把一部分數據流量引向那臺服務器，這勢必造成大量的服務請求被丟失，達不到不間斷可用性的要求。所以良好的負載均衡策略應有對網絡故障、服務器系統故障、應用服務故障的檢測方式和能力：
Ping偵測：通過ping的方式檢測服務器及網絡系統狀況，此種方式簡單快速，但只能大致檢測出網絡及服務器上的操作系統是否正常，對服務器上的應用服務檢測就無能爲力了。

TCP Open偵測：每個服務都會開放某個通過TCP連接，檢測服務器上某個TCP端口（如Telnet的23口，HTTP的80口等）是否開放來判斷服務是否正常。

HTTP URL偵測：比如向HTTP服務器發出一個對main.html文件的訪問請求，如果收到錯誤信息，則認爲服務器出現故障。
負載均衡策略的優劣除受上面所講的兩個因素影響外，在有些應用情況下，我們需要將來自同一客戶端的所有請求都分配給同一臺服務器去負擔，例如服務器將客戶端註冊、購物等服務請求信息保存的本地數據庫的情況下，把客戶端的子請求分配給同一臺服務器來處理就顯的至關重要了。有兩種方式可以解決此問題，一是根據IP地址把來自同一客戶端的多次請求分配給同一臺服務器處理，客戶端IP地址與服務器的對應信息是保存在負載均衡設備上的；二是在客戶端瀏覽器 cookie內做獨一無二的標識來把多次請求分配給同一臺服務器處理，適合通過代理服務器上網的客戶端。
　　還有一種路徑外返回模式（Out of Path Return），當客戶端連接請求發送給負載均衡設備的時候，中心負載均衡設備將請求引向某個服務器，服務器的迴應請求不再返回給中心負載均衡設備，即繞過流量分配器，直接返回給客戶端，因此中心負載均衡設備只負責接受並轉發請求，其網絡負擔就減少了很多，並且給客戶端提供了更快的響應時間。此種模式一般用於HTTP服務器羣，在各服務器上要安裝一塊虛擬網絡適配器，並將其IP地址設爲服務器羣的VIP，這樣才能在服務器直接回應客戶端請求時順利的達成三次握手。
http://www.douban.com/group/topic/9775643/

jibcy

發佈了3 篇原創文章 · 獲贊 13 · 訪問量 21萬+

私信關注

負載均衡技術全攻略

負載均衡實施要素

lVS+lamp安裝配置

深入理解HTTP協議

從myspace數據庫看分佈式系統數據結構變遷

負載均衡技術全攻略

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結