大流量網站的底層系統架構

大流量網站的底層系統架構

動態應用,是相對於網站靜態內容而言, 是指以 C/C++、PHP、JAVA、Perl、.NET 等服務器端語言開發的網絡應用軟件,比如論壇、網絡相冊、交友、BLOG 等常見應用。動態應用系統通常與數據庫系統、緩存系統、分佈式存儲系統等密不可分。


大型動態應用系統平臺主要是針對於大流量、高併發網站建立的底層系統架構。大型網站的運行需要一個可靠、安全、可擴展、易維護的應用系統平臺做爲支撐,以保證網站應用的平穩運行。


大型動態應用系統又可分爲幾個子系統


WEB 前端系統、負載均衡系統、數據庫集羣系統、緩存系統、分佈式存儲系統、分佈式服務器管理系統、代碼分發系統。


WEB 前端系統


b3b7d0a20cf431ad381a09ec4b36acaf2fdd981f


爲了達到不同應用的服務器共享、避免單點故障、集中管理、統一配置等目的,不以應用劃分服務器,而是將所有服務器做統一使用,每臺服務器都可以對多個應用提供服務,當某些應用訪問量升高時,通過增加服務器節點達到整個服務器集羣的性能提高。該 WEB 前端系統基於 Apache/Lighttpd/Nginx 等的虛擬主機平臺,提供 PHP 程序運行環境。服務器對開發人員是透明的,不需要開發人員介入服務器管理。


負載均衡系統


8ad4b31c8701a18b1371a79a9e2f07082938fe49


負載均衡系統分爲硬件和軟件兩種。硬件負載均衡效率高,但是價格貴,比如 F5 等。軟件負載均衡系統價格較低或者免費,效率較硬件負載均衡系統低,不過對於流量一般或稍大些網站來講也足夠使用,比如 lvs、Nginx。大多數網站都是硬件、軟件負載均衡系統並用。


數據庫集羣系統


3ac79f3df8dcd100f9394df4728b4710b8122fb9


由於 WEB 前端採用了負載均衡集羣結構提高了服務的有效性和擴展性,因此數據庫必須也是高可靠的才能保證整個服務體系的高可靠性,如何構建一個高可靠的、可以提供大規模併發處理的數據庫體系?


我們可以採用如上圖所示的方案:


○ 使用 MySQL 數據庫,考慮到 WEB 應用的數據庫讀多寫少的特點,我們主要對讀數據庫做了優化,提供專用的讀數據庫和寫數據庫,在應用程序中實現讀操作和寫操作分別訪問不同的數據庫。

○ 使用 MySQL Replication 機制實現快速將主庫(寫庫)的數據庫複製到從庫(讀庫)。一個主庫對應多個從庫,主庫數據實時同步到從庫。

○ 寫數據庫有多臺,每臺都可以提供多個應用共同使用,這樣可以解決寫庫的性能瓶頸問題和單點故障問題。

○ 讀數據庫有多臺,通過負載均衡設備實現負載均衡,從而達到讀數據庫的高性能、高可靠和高可擴展性。

○ 數據庫服務器和應用服務器分離。

○ 從數據庫使用 BigIP 做負載均衡。


緩存系統


c2fdfc039245d68899090671a4c27d1ed31b24df


緩存分爲文件緩存、內存緩存、數據庫緩存。在大型 WEB 應用中使用最多且效率最高的是內存緩存。最常用的內存緩存工具是 Memcachd。使用正確的緩存系統可以達到實現以下目標:


○ 使用緩存系統可以提高訪問效率,提高服務器吞吐能力,改善用戶體驗。

○ 減輕對數據庫及存儲集服務器的訪問壓力

○ Memcached 服務器有多臺,避免單點故障,提供高可靠性和可擴展性,提高性能。


分佈式存儲系統


562c11dfa9ec8a13ca51e335f703918fa1ecc098


WEB 系統平臺中的存儲需求有下面兩個特點


○ 存儲量很大,經常會達到單臺服務器無法提供的規模,比如相冊、視頻等應用。因此需要專業的大規模存儲系統。

○ 負載均衡 cluster 中的每個節點都有可能訪問任何一個數據對象,每個節點對數據的處理也能被其他節點共享,因此這些節點要操作的數據從邏輯上看只能是一個整體,不是各自獨立的數據資源。


因此高性能的分佈式存儲系統對於大型網站應用來說是非常重要的一環。(這個地方需要加入對某個分佈式存儲系統的簡單介紹。)


分佈式服務器管理系統


d833c895d143ad4bbb75f11582025aafa50f068f


隨着網站訪問流量的不斷增加,大多的網絡服務都是以負載均衡集羣的方式對外提供服務,隨之集羣規模的擴大,原來基於單機的服務器管理模式已經不能夠滿足我們的需求,新的需求必須能夠集中式的、分組的、批量的、自動化的對服務器進行管理,能夠批量化的執行計劃任務。


在分佈式服務器管理系統軟件中有一些比較優秀的軟件,其中比較理想的一個是 Cfengine。它可以對服務器進行分組,不同的分組可以分別定製系統配置文件、計劃任務等配置。它是基於 C/S 結構的,所有的服務器配置和管理腳本程序都保存在 Cfengine Server 上,而被管理的服務器運行着 Cfengine Client 程序,Cfengine Client 通過 SSL 加密的連接定期的向服務器端發送請求以獲取最新的配置文件和管理命令、腳本程序、補丁安裝等任務。


有了 Cfengine 這種集中式的服務器管理工具,我們就可以高效的實現大規模的服務器集羣管理,被管理服務器和 Cfengine Server 可以分佈在任何位置,只要網絡可以連通就能實現快速自動化的管理。


代碼發佈系統


fd039245d688d43fcad726277d1ed21b0ff43bec


隨着網站訪問流量的不斷增加,大多的網絡服務都是以負載均衡集羣的方式對外提供服務,隨之集羣規模的擴大,爲了滿足集羣環境下程序代碼的批量分發和更新,我們還需要一個程序代碼發佈系統。


這個發佈系統可以幫我們實現下面的目標:


○ 生產環境的服務器以虛擬主機方式提供服務,不需要開發人員介入維護和直接操作,提供發佈系統可以實現不需要登陸服務器就能把程序分發到目標服務器。

○ 我們要實現內部開發、內部測試、生產環境測試、生產環境發佈的 4 個開發階段的管理,發佈系統可以介入各個階段的代碼發佈。

○ 我們需要實現源代碼管理和版本控制,SVN 可以實現該需求。


這裏面可以使用常用的工具 Rsync,通過開發相應的腳本工具實現服務器集羣間代碼同步分發。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章