用 windows2000 實現雙機熱備

用 windows2000 實現雙機熱備

作者:唐華

轉自:千際博客 www.2ok.cn

 


在傳統的終端 / 主機的網絡模式時代,終端功能簡單,無需維護工作,在主機一端進行專門的管理與維護,具有資源共享、便於管理的特點。但是,主機造價昂貴,終端沒有處理能力,限制了網絡的規模化發展。之後的客戶機 / 服務器模式推進了計算產業的標準化和開發化的發展,爲系統提供了相當大的靈活性,但是隨着分佈系統規模的規模擴大,系統的維護和管理帶來了巨大的開銷。
而服務器集羣系統中,服務器不再分佈在各處,而是集中在一起統一進行管理和維護。它保持了分佈式客戶機 / 服務器模式的開發性、可擴展性的優點,同時又具備了終端 / 主機模式的資源共享和集中易於管理的優點。相對集中的集羣系統,降低了系統管理的成本,而且還提供了和大型服務器系統相媲美的處理能力。

面向 Internet 的服務型應用,需要高性能的硬件平臺作爲支持,將並行技術應用在服務器領域中,是計算機發展的必然趨勢。並行處理技術在高性能計算領域中,高可用和高性能是集羣服務器系統發展的兩個重要方向。

集羣的概念

集羣英文名稱是 CLUSTER ,是一組相互獨立的、通過高速網絡互聯的計算機,它們構
成了一個組,並以單一系統的模式加以管理。一個客戶與集羣相互作用時,集羣像是一個獨立的服務器。集羣配置是用於提高可用性和可縮放性。

和傳統的高性能計算機技術相比,集羣技術可以利用各檔次的服務器作爲節點,系統造價低,可以實現很高的運算速度,完成大運算量的計算,具有較高的響應能力,能夠滿足當今日益增長的信息服務的需求。

集羣技術應用的需求

Internet 用戶數量呈幾何級數增長和科學計算的複雜性要求計算機有更高的處理能力,而 CPU 的發展無法跟上不斷增長的需求,於是我們面臨以下問題:

●大規模計算如基因數據的分析、氣象預報、石油勘探需要極高的計算性能。

●應用規模的發展使單個服務器難以承擔負載。

●不斷增長的需求需要硬件有靈活的可擴展性。

●關鍵性的業務需要可靠的容錯機制。

IA 集羣系統( CLUSTER )的特點

●由若干完整的計算機互聯組成一個統一的計算機系統;

●可以採用現成的通用硬件設備或特殊應用的硬件璞福繾ㄓ玫耐ㄑ渡璞福 ?

●需要特殊軟件支持,例如支持集羣技術的操作系統或數據庫等等;

●可實現單一系統映像,即操作控制、 IP 登錄點、文件結構、存儲空間、 I/O 空間、作業管理系統等等的單一化;

●在集羣系統中可以動態地加入新的服務器和刪除需要淘汰的服務器,從而能夠最大限度地擴展系統以滿足不斷增長的應用的需要;

●可用性是集羣系統應用中最重要的因素,是評價和衡量系統的一個重要指標;

●能夠爲用戶提供不間斷的服務,由於系統中包括了多個結點,當一個結點出現故障的時候,整個系統仍然能夠繼續爲用戶提供服務;

●具有極高的性能價格比,和傳統的大型主機相比,具有很大的價格優勢;

●資源可充分利用,集羣系統的每個結點都是相對獨立的機器,當這些機器不提供服務或者不需要使用的時候,仍然能夠被充分利用。而大型主機上更新下來的配件就難以被重新利用了。

實現服務器集羣的硬件配置
●網絡服務器 兩臺
●服務器操作系統硬盤 兩塊
● ULTRA 160 LVD SCSI 磁盤陣列 一個
● 18G SCSI 硬盤 三塊
●網絡服務網卡 四塊
服務器集羣的實踐步驟

●在安裝機羣服務之前的準備:

1、 三塊 18G SCSI 硬盤組成磁盤陣列,做 RAID5 。
2、 兩臺服務器要求都配置雙網卡,分別安裝 Microsoft Windows 2000 Advance Server 操作系統,並配置網絡。
3、 所有磁盤必須設置成基本盤,陣列磁盤分區必須大於 2 個。
4、 每臺服務器都要加入域當中,成爲域成員,並且在每臺服務器上都要有管理員權限。

●安裝配置服務器網絡要點
1 、在這一部分,每個服務器需要兩個網絡適配器,一個連接公衆網,一個連接內部網(它只包含了羣集節點)。 內部網適配器建立點對點的通信、羣集狀態信號和羣集管理。每個節點的公衆網適配器連接該羣集到公衆網上,並在此駐留客戶。
2 、安裝 Microsoft Windows 2000 Adwance Server 操作系統後,開始配置每臺服務器的網絡。在網絡連接中我們給連接公衆網的命名爲“外網”,連接內部網的命名爲“內網”並分別指定 IP 地址爲:
節點 1 :內網: ip : 10.10.10.11 外網 ip : 192.168.0.192 子網掩碼: 255.255.255.0 網關: 192.168.0.191 (主域控制器 ip )
節點 2 :內網: ip : 10.10.10.12 外網 ip : 192.168.0.193 子網掩碼: 255.255.255.0 網關: 192.168.0.191

●安裝配置陣列

1 、對陣列做可校驗的 RAID5 。並劃分分區。創建一個小分區(至少 50 兆)用來存儲羣集
配置數據庫的檢測點和日誌文件。這是集羣中一個重要的關鍵分區,一但他出現故障,將導
致整個集羣的失敗。這裏我們分配給他 1G 的空間,並命名爲 X 盤符。
2 、其他的分區根據用戶的需求可以自行設定。我們爲了方便只分了一個 Y 區。
3 、注意:在集羣中所有的磁盤都必須是基本盤並且都要採用 NTFS 格式。

●安裝集羣服務軟件

【配置首節點】

1 、所有的設備都先關閉(兩臺服務器、一臺磁盤陣列)。
2 、先開啓磁盤陣列(在任何時候都要先開啓磁盤陣列,以免造成磁盤混亂)。
3 、開啓節點 1 ,用有管理員權限的用戶名登陸到域,用添加刪除程序來添加組件—集羣服
務。在安裝過程中選擇這是集羣的首節點。創建集羣名稱。我們給命名爲 Mycluster 。
5、 配置羣集磁盤。由於我們只有一個共享的磁盤陣列,所以我們將這個陣列中的兩個分區
都配置成羣集磁盤。
6 、配置羣集網絡。首先我們配置外網,網絡名稱選擇外網。 IP 地址保持和外網的 IP 地址一致。選中該網絡可用於集羣服務。選中所有的通信(混合網絡)選項。進行下一步。接下來配置內網,確保網絡名稱和 IP 地址跟內網的一致,選中該網絡可用於集羣服務。選中只用於內部羣集通信選項。
7、 點擊下一步按鈕,屏幕出現使用網絡的順序。我們調整爲表裏的第一個連接是內網。這是因爲:在正常的操作中,該連接將用於羣集通信。如果內部網絡連接失效,羣集服務將自動切換到表裏的下一個網絡。
8、執行下一步將出現集羣的 IP 和掩碼選項。這裏輸入唯一的集羣 IP ,我們設定爲 192.168.0.195 掩碼當然還是: 255.255.255.0 。
9 、單擊完成,完成首節點的羣集配置。

【配置第二個節點】

1 、保持陣列和第一個節點的開機和可用。給第二個節點上電開機。
2 、象在首節點上安裝羣集服務一樣,對第二個節點開始進行安裝。
3 、過程跟在首節點上在安裝羣集服務大體相同,只有下列的不同之處:
在創建或添加羣集對話框中,在羣集中選擇第二個或下一個節點,並單擊下一步。
輸入前面所創建的羣集名稱(在本例中,是 MyCluster ),並單擊下一步。
將連接到羣集設爲未選中。羣集服務配置嚮導將自動提供,在安裝首節點時選定 的用戶帳號名稱。
輸入該帳號的口令(如果有的話),並單擊下一步。
在下一個對話框中,單擊完成,結束配置。
將啓動羣集服務。單擊確定。
關閉添加 / 刪除程序
如果要安裝額外的節點,重複這些步驟,以便在其它節點上安裝羣集服務。
檢驗安裝
單擊開始,單擊程序,單擊管理工具,並單擊羣集管理器。顯示的兩個節點表明,存在羣集,而且它在運行。
效能評測
●容錯能力的檢驗
對於他的容錯能力我們做了以下幾個實驗:
1 、在兩臺節點和集羣服務同時運行的情況下,斷掉其中一個節點的外網連接或是當掉一臺節點,此時運行在這個節點上的集羣服務被迫斷開並轉移到另外一個連接正常的節點上,此過程大概要 4 秒鐘(視集羣上運行的服務數量而定,在安裝了 SQL Server 2000 服務之後這個過程延長到了 9-15 秒)。
2 、在兩臺節點和集羣服務同時運行的情況下,我們更改了一臺節點的時間,在經過大約 10 分鐘時間被修改的時間自動調整成同另一臺節點相同的設置。
3 、我們在集羣服務上開啓了 web 服務,並設置了下載項目。在客戶端正在下載過程中斷掉集羣中的一個節點,客戶端並沒有明顯的感覺出有變化。
由以上實驗可見用 Windows 2000 Advance Server 所做的集羣在容錯方面具有良好的效能,他幾乎是瞬間就能把出錯的節點上的服務接管過來,相對於客戶端幾乎感覺不到有任何變化。同時他在週期時間內所有節點進行同步,以保證其一致性。
●負載均衡能力的檢驗
1 、 Windows 2000 Advance Server 所做的集羣是基於 TCP/IP 構建的,他爲共同工作且使用兩個或兩個以上主機羣集的 Web 服務器提供了高度可用性和可伸縮性。因特網客戶使用單一的 IP 地址訪問羣集。客戶不能將單一服務器從羣集中區分開來。服務器程序不能識別它們正運行於一個羣集中。但是,由於網絡負載均衡羣集即使在羣集主機發生故障的情況下仍能提供了不間斷的服務,故而,它與運行單一服務器程序的單一主機大相徑庭。與單一主機相比,羣集還能對客戶需求做出更迅捷的反應。
注意要點
我們在做集羣實驗的過程當中遇到了一些問題,雖然最後都順利的解決了,但我想還是要在這裏提出來讓大家注意,避免在今後的工作中出現不必要的重複的錯誤。
1 、共享磁盤之中 X 盤的重要性。在實驗的過程中我們也知道 X 盤相當重要,爲了驗證他的
重要地位,我們做了如下實驗:我們首先看到在 X 盤下面只有一個 MSDN 的文件夾,其中
有兩個文件 *.tmp 和 *.log ,這就是上文所說的羣集配置數據庫的檢測點和日誌文件。我們試
着刪除這兩個文件,結果 *.tmp 可以刪除, *.log 文件正在使用而無法刪除。刪除了 *.tmp 文
件之後我們重新啓動兩臺節點和集羣。一切正常,進入 X 盤看他的文件,發現被刪除的 *.tmp
文件又重新回到了裏面,只是名字稍有些改變。這表明 *.tmp 文件是每次集羣啓動時自動生
成的一個文件,而集羣啓動以後,這個文件就不在被使用。接着我們進行了一個後來被證明
是毀滅性的實驗,我們在我的電腦管理裏面的調整了磁盤管理,把 X 盤刪除了。結果可怕
的事情發生了,在不到 10 秒鐘的時間內兩臺節點相繼報告機羣服務發生錯誤將不能運行且
終止服務。我們嘗試再次進入磁盤管理,發現陣列的磁盤已經變成了不可讀取。無奈之下我
們重新啓動所有設備,期望能發生超乎設想的好的結果,但是事實讓我們不得不失望。集羣
服務無法啓動,陣列磁盤不可讀取。在沒有任何辦法的情況下我們不得不重新配置集羣。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章