Windows Server 2003服務器羣集創建和配置指南

服務器羣集是一組協同工作並運行Microsoft羣集服務(Microsoft Cluster Service,MSCS)的獨立服務器。服務器羣集爲資源和應用程序提供高可用性、故障恢復、可伸縮性和可管理性。
服務器羣集允許客戶端在出現故障和計劃中的暫停時,依然能夠訪問應用程序和資源。如果羣集中的某一臺服務器由於故障或維護需要而無法使用,資源和應用程序將轉移到可用的羣集節點上。
Windows羣集(Windows Clustering)解決方案使用了名詞“高可用性”而非“容錯”。容錯技術提供更高層次的彈性和恢復能力。容錯服務器通常使用深層硬件冗餘,加上專門的軟件,幾乎可以即時地恢復任何單一的硬件或軟件錯誤。這些解決方案要比Windows羣集(Windows Clustering)解決方案昂貴得多,因爲組織必須爲處於空閒狀態等待錯誤的冗餘硬件支付費用。
服務器羣集無法保證無間斷運作,但是確實能夠爲多數關鍵任務應用程序提供足夠的可用性。羣集服務可以對應用程序和資源進行監控,並能夠自動識別和恢復衆多故障狀況。這爲在羣集中管理工作負荷提供了靈活性。另外,還提高了整個系統的可用性。
羣集服務(Cluster service)的優點包括:
•        高可用性:通過服務器羣集,資源(例如:磁盤驅動器和Internet協議(IP)地址)的所有權會自動從故障服務器轉移到可用的服務器。當羣集中的某個系統或應用程序發生故障時,羣集軟件會在可用的服務器上重新啓動故障應用程序,或者將工作從故障節點分散到剩下的節點上。由此,用戶只在瞬間感覺到服務的暫停。
•        故障恢復:當故障服務器重新回到其預定的首選所有者的聯機狀態時,羣集服務將自動在羣集中重新分配工作負荷。該特性可配置,但默認禁用。
•        可管理性:您可以使用“羣集管理器”工具(CluAdmin.exe),將羣集作爲一個單一的系統進行管理,並對猶如運行於一個單一服務器的應用程序實施管理。您可以將應用程序轉移到羣集中的其它服務器。“羣集管理器”可用於手動平衡服務器的工作負荷,並針對計劃維護釋放服務器。您還可以監控羣集的狀態、所有節點以及來自網絡任何地方的資源。
•        可伸縮性:羣集服務可擴展以滿足需求的增長。當羣集監督應用程序的總體負荷超出了羣集的能力範圍時,可以添加附加的節點。
本文檔提供有關針對連接到共享羣集存儲設備並運行Server 2003 Enterprise Edition或Windows Server 2003的服務器創建和配置服務器羣集的指導。本文檔的目的是爲了指引您完成安裝典型羣集的步驟,並未解釋如何安裝羣集應用程序。而對於實施非傳統仲裁模型,如:多數節點集(Majority Node Set,MNS),的Windows羣集(Windows Clustering)解決方案和地理位置分散的羣集也不予以討論。關於服務器羣集概念以及安裝和配置步驟的附加信息,請參見“Windows Server 2003在線幫助”。
服務器羣集配置清單:
本清單幫助您進行安裝準備,其後接具體的步驟指導。
軟件要求
•        羣集中的所有計算機均安裝了Microsoft Windows Server 2003 Enterprise Edition或Windows Server 2003 Datacenter Edition。
•        一個名稱解析法,比如:域名系統(Domain Name System,DNS)、DNS動態更新協議、Windows Internet名稱服務(Windows Internet Name Service,WINS)、HOSTS等等。
•        一個現有的域模型。
•        所有的節點必須是同一個域的成員。
•        一個域級帳戶,必須是每個節點上的本地管理員組的成員。建議採用專用帳戶。
硬件要求
•        羣集硬件必須屬於羣集服務硬件兼容性列表(Hardware Compatibility List,HCL)。要查找最新的羣集服務硬件兼容性列表,請登陸位於[url]http://www.microsoft.com/hcl/[/url]的Windows 硬件兼容性列表(Windows Hardware Compatibility List),然後搜索“cluster”(羣集)。整個解決方案必須得到HCL認證,而不僅僅是個別組件。附件信息,請在Microsoft知識庫(Microsoft Knowledge Base)中參閱下方文章:
309395 Microsoft對於服務器羣集和硬件的支持策略(The Microsoft Support Policy for Server Clusters and the Hardware)
注意:如果您正在存儲區域網絡(SAN)上安裝該羣集,並計劃讓多個設備和羣集與之共享SAN,那麼該解決方案也必須服從“羣級/多羣集設備(Cluster/Multi-Cluster Device)”硬件兼容性列表。附加信息,請在Microsoft知識庫中參閱下方文章:
304415 針對附加到相同SAN設備的多羣集的支持(Support for Multiple Clusters Attached to the Same SAN Device)
•        兩個超大存儲設備控制器——小型計算機系統接口(Small Computer System Interface,SCSI)或光纖通道(Fibre Channel);一個用於在其中一個域控制器上安裝操作系統(OS)的本地系統磁盤;一個面向共享磁盤的獨立的外圍組件互連( PCI)存儲控制器。
•        羣集中的每個節點擁有兩個PCI網絡適配器。
•        將共享存儲設備附加到所有計算機的存儲電纜。參考關於配置存儲設備的製造商指南。參見本文後面的附錄,瞭解有關使用SCSI或光纖通道(Fibre Channel)所需的特定配置。
•        對於所有的節點,一切硬件都必須是可識別的,對應正確的插槽、設備卡、BIOS、固件修訂版等等。這將使配置變得更加簡單,同時消除兼容性問題。
網絡要求
•        一個唯一的NetBIOS名稱。
•        每個節點上的所有網絡界面均擁有靜態IP地址。
注意:服務器羣集(Server Clustering)不支持使用由動態主機配置協議(Dynamic Host Configuration Protocol,DHCP)服務器分配的地址。
•        接入一個域控制器。如果羣集服務無法驗證用於啓動服務的用戶帳戶,可能導致羣集發生故障。建議您在羣集所在的相同的局域網(LAN)上擁有一個域控制器,以便確保其可用性。
•        每個節點至少必須擁有兩個網絡適配器——一個用於連接客戶端公用網絡,另一個用於連接節點對節點專用羣集網絡。HCL認證要求一個專用網絡適配器。
•        所有節點都必須擁有兩個面向公用和專用通信的物理獨立的局域網(LAN)或虛擬局域網(LAN)。
•        如果您正在使用容錯網卡或網絡適配器組合,確認您正在使用最新的固件和驅動程序。向您的網絡適配器製造商覈實羣集兼容性。
共享磁盤要求
•        一個經HCL認可的連接到所有計算機的外部磁盤存儲單元。其將用作羣集共享磁盤。建議採用某種類型的硬件獨立磁盤冗餘陣列( RAID)。
•        所有共享磁盤,包括仲裁磁盤,必須在物理上附加到一個共享總線。
注意:以上要求並不適用於多數節點集( Majority Node Set,MNS)羣集。這類羣集本指南不予討論。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#2
發表於 2007-3-30 13:26  資料 短消息
•        共享磁盤必須位於系統驅動器所用的控制器以外的另一個控制器上。
•        建議在RAID配置中創建多個硬件級別的邏輯驅動器,而不是使用一個單一的邏輯磁盤,然後將其分成多個操作系統級別的分區。這不同於獨立服務器通常所採用的配置。但是,它使您可以在羣集中擁有多個磁盤資源,並跨節點執行“活動/活動(Active/Active)”配置和手動負載平衡。
•        最小50兆字節(MB)的專用磁盤用作仲裁設備。爲了得到最佳的NTFS文件系統性能,建議採用最小500 MB的磁盤分區。
•        確認可以從所有的節點看到附加到共享總線的磁盤。這可以在主適配器安裝中進行查看。請參考製造商的文檔,瞭解適配器指定的指導說明。
•        必須根據製造商的指導說明,對SCSI設備分配唯一的SCSI標識號,並正確地將其端接。參見本文附錄,瞭解有關安裝和端接SCSI設備的信息。
•        所有共享磁盤必須配置爲基本磁盤。附加信息,請在Microsoft知識庫中參閱下方文章:

237853 服務器羣集磁盤資源不可用的動態磁盤配置(Dynamic Disk Configuration Unavailable for Server Cluster Disk Resources)
•        羣集共享磁盤不支持軟件容錯。
•        在運行64位版本的Windows Server 2003的系統上,所有共享磁盤必須配置爲主引導記錄(MBR)。
•        羣集磁盤上的所有分區必須格式化爲NTFS。
•        建議所有磁盤均採用硬件容錯RAID配置。
•        建議最少採用兩個邏輯共享驅動器。

羣集安裝
安裝概述
在安裝過程中,安裝某些節點時將關閉其它節點。這個步驟有助於保證附加到共享總線的磁盤上的數據不會丟失或遭到破壞。當多個節點同時嘗試寫入一個未受到羣集軟件保護的磁盤時,可以出現數據丟失或遭到破壞的情況。與 Microsoft® Windows® 2000系統不同,Windows 2003 Server中新磁盤的默認裝載方式有所變化。在Windows 2003中,將不會對與引導分區不在同一總線的邏輯磁盤進行自動裝載和分配驅動器號。這有助於確保在複雜的SAN環境中,服務器不會裝載可能屬於另一臺服務器的驅動器。儘管驅動器不會被自動裝載,但是仍然建議您按照下列步驟,確認共享磁盤不會遭到破壞。
使用下表確定在每一個步驟必須關閉的節點和存儲設備。
本指南中的步驟面向雙節點羣集。而如果您正在安裝擁有兩個以上節點的羣集,那麼“節點2”一欄將列出其它所有節點所要求的狀態。
1.        步驟        2.        節點1        3.        節點2        4.        存儲        5.        備註
設置網絡        開啓        開啓        關閉        確認共享總線上的所有存儲設備均已關閉。開啓所有節點。
設置共享磁盤        開啓        關閉        開啓        關閉所有節點。開啓共享存儲,再開啓第一個節點。
驗證磁盤配置        關閉        開啓        開啓        開啓第一個節點,開啓第二個節點。如果需要,可以針對第三和第四個節點重複相同的步驟。
配置第一個節點        開啓        關閉        開啓        關閉所有節點;開啓第一個節點。
配置第二個節點        開啓        開啓        開啓        順利配置完第一個節點後,開啓第二個節點。如果需要,可以針對第三和第四個節點重複相同的步驟。
安裝後        開啓        開啓        開啓        所有節點均必須開啓。

在配置羣集(Cluster)服務軟件前,必須先執行幾個步驟。這些步驟是:
•        在每個節點上安裝Windows Server 2003 Enterprise Edition或Windows Server 2003 Datacenter Edition操作系統。
•        設置網絡。
•        設置磁盤。
在第一個節點上開始安裝羣集服務前,在每一個羣集節點上執行這些步驟。
要配置羣集服務,您必須登錄一個擁有所有節點管理許可的帳戶。每個節點都必須是同一個域的成員。如果您選擇將其中一個節點作爲域控制器,那麼在相同的子網上再設置一個域控制器,以便消除單點故障,並對該節點進行維護。
安裝Windows Server 2003操作系統
參考您從Windows Server 2003操作系統軟件包中得到的文檔,以便在羣集中的每個節點上安裝該系統。
配置羣集服務之前,您必須在本地登錄一個屬於本地管理員組成員的域帳戶。
注意:如果您試圖將一個節點加入一個具有空白的本地管理員帳戶密碼的羣集,安裝將會失敗。基於安全原因,Windows Server 2003禁止使用空白的管理員密碼。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#3
發表於 2007-3-30 13:28  資料 短消息
設置網絡
每個羣集節點至少需要包含兩個網絡適配器的兩個或兩個以上的獨立網絡,以便避免單點故障。其中一個網絡適配器用於連接到公用網絡,而另一個則用於連接到僅由羣集節點組成的專用網絡。擁有多個網絡適配器的服務器被稱爲“多宿主”。由於多宿主服務器可能存在問題,因此遵照本文檔中所描述的網絡配置建議,對您來說至關重要。
Microsoft要求您在每個節點上擁有兩個經硬件兼容性列表(Hardware Compatibility List,HCL)許可並得到Microsoft產品支持服務(Microsoft Product Support Services)支持的PCI(Peripheral Component Interconnect,外圍組件互連)網絡適配器。通過一個靜態IP地址,在您的生產網絡上配置其中一個網絡適配器,並在另一個用於進行專用羣集通信的子網上,通過另一個靜態IP地址,在一個獨立的網絡上配置另一個網絡適配器。
服務器羣集節點間的通信對於羣集的順暢運轉至關重要。因此,您必須對用於羣集通信的網絡執行最佳配置,並遵照硬件兼容性列表上的所有要求。
專用網絡適配器用於執行節點對節點的通信、羣集狀態信息和羣集管理。每個節點的公用網絡適配器都將羣集連接到客戶端所在的公用網絡,並應配置爲內部羣集通信的後備路由。要實現這些操作,應該將羣集服務的這些網絡角色配置爲“只用於內部羣集通信”或“所有通信”。
此外,每個羣集網絡必須獨立於其它所有羣集網絡之外發生故障。這意味着,兩個羣集網絡不能擁有可能同時導致其出現故障的組件。例如:在多數情況中,使用多端口網絡適配器將一個節點附加到兩個羣集網絡,將無法滿足該要求,因爲其端口不是獨立的。
要消除可能的通信問題,從網絡適配器刪除所有不必要網絡流量,即設置爲“只用於內部羣集通信”(該適配器也被稱爲心跳或專用網絡適配器)。
要驗證所有的網絡連接均準確無誤,專用網絡適配器必須位於另一個來自公用網絡適配器的邏輯網絡上的網絡。這可以通過在雙節點配置中使用跨接電纜,或者在兩個以上的節點配置中使用專門的啞集線器來實現。不要針對核心網絡使用交換機、智能集線器或其它任何路由選擇設備。

注意:羣集心跳不能通過路由選擇設備進行轉移,因爲它們的生存時間(Time to Live,TTL)被設定爲1。公共網絡適配器只能連接到公用網絡。如果您擁有一個虛擬局域網(LAN),那麼節點間的等待時間必須少於500毫秒(ms)。另外,在Windows Server 2003中,服務器羣集(Server Clustering)中的心跳被改爲多播的形式;所以,您可能需要提供一臺Madcap服務器,以便分配多播地址。附加信息,請在Microsoft知識庫中參閱下方文章:
307962 針對羣集心跳啓用多播支持(Multicast Support Enabled for the Cluster Heartbeat)
•        下方的圖 1簡要描繪了一個四節點羣集的配置。  
•      
圖1. 四節點羣集的連接。

常規網絡配置:
注意:本指南假定您正在運行默認的“開始”菜單。如果您使用傳統的“開始”菜單,那麼具體步驟可能稍有不同。在本白皮書中,第一個網絡適配器(本地連接)被連接到公用網絡,而第二個網絡適配器(本地連接2)則被連接到專用羣集網絡。您的網絡可能有所不同。
重命名局域網圖標
建議您更改網絡連接的名稱,以便清楚地進行識別。例如:您可能想把“本地連接2”的名稱更改爲“Private”(專用網絡)。重命名將有助於您識別網絡並對其正確地分配角色。
1.        單擊“開始”,指向“控制面板”,右擊“網絡連接”,然後單擊“打開”。
2.        右擊“本地連接2”圖標。
3.        單擊“重命名”。
4.        在文本框中鍵入“ Private”(專用網絡),然後按“ENTER”鍵。
5.        重複步驟1至3,然後將公用網絡適配器重命名爲“Public”(公用網絡)。

圖 2. “網絡連接”窗口中被重新命名的圖標。
6.        重命名的圖標如上方圖2所示。關閉“網絡連接”窗口。新的連接名稱將出現在“羣集管理器”中,並將在聯機時自動複製到其它所有的羣集節點。

在所有節點上配置綁定順序網絡
1.        單擊“開始”,指向“控制面板”,右擊“網絡連接”,然後單擊“打開”。
2.        在“高級”菜單上,單擊“高級設置”。
3.        在“連接”窗口中,確認您的綁定順序如下所示,然後單擊“確定”:
a) 公用網絡
b) 專用網絡
c) 遠程訪問連接

配置專用網絡適配器
1.        右擊您的心跳適配器對應的網絡連接,然後單擊“屬性”。
2.        在“常規”選項卡上,確認僅選定了“Internet協議(TCP/IP)”複選框,如下方圖2所示。點擊清除所有其它客戶端、服務和協議的複選框。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#4
發表於 2007-3-30 13:30  資料 短消息
圖 3. 在“專用網絡屬性”對話框中,僅點擊選定“Internet協議”複選框。
3.        如果您擁有一個能夠以不同速度進行傳輸的網絡適配器,那麼您應該手動指定一個速度及雙工模式。不要對傳輸速度應用自動選擇設置,因爲某些適配器在確定速度時可能丟掉一些數據包。必須根據設備卡製造商的規格說明,將所有節點上的網絡適配器的速度硬性設定(手動設定)爲相同的值。如果您不能確定您的設備卡和連接設備所支持的速度,Microsoft建議您將同一路徑上的所有設備設定爲“10兆字節每秒”(Mbps)和“半雙工”,如下方圖4所示。雖然通過心跳網絡的信息量較小,但是等待時間對於通信至關重要。該配置將爲可靠的通信提供充足的帶寬。羣集中附加到相同網絡的所有網絡適配器必須統一設定爲使用相同的 “雙工模式”、“連接速度”、“流控制”等等。聯繫您的適配器製造商,瞭解有關您的網絡適配器的正確的速度和雙工設置的特定信息。
圖 4. 爲所有適配器設置速度和雙工。

注意:Microsoft不推薦您針對心跳使用任何類型的容錯適配器或“Teaming”(組合)。如果您需要冗餘的心跳連接,可以使用多個設定爲“只用於內部通信”的網絡適配器,並在“羣集”配置中定義它們網絡優先級。早期多端口網絡適配器常常存在問題,如果您使用該技術,請確認您的固件和驅動程序都屬於最新的版本。
聯繫您的網絡適配器製造商,瞭解有關服務器羣集上兼容性的信息。如需獲得更多信息,請在Microsoft知識庫中參閱下方文章:
254101 網絡適配器組合與服務器羣集(Network Adapter Teaming and Server Clustering)
4.        單擊“Internet協議(TCP/IP)”,然後單擊“屬性”。
5.        在“常規”選項卡上,確認您所選擇的靜態IP地址與其它任何公用網絡適配器不在相同的子網或網絡上。建議您將專用網絡適配器放置在以下任何一個專用網絡地址域內:
•        10.0.0.0到10.255.255.255         (A類)
•        172.16.0.0到172.31.255.255         (B類)
•        192.168.0.0到192.168.255.255         (C類)
對專用適配器應用一個較好的IP地址的範例是:將節點1的地址設爲10.10.10.10,將節點2的地址設爲10.10.10.11,同時將子網掩碼設爲255.0.0.0,如下方圖5所示。確認該IP地址方案與應用於公用網絡的IP地址方案完全不同。
注意:有關專用網絡的有效IP尋址的附加信息,請在Microsoft知識庫中參閱下方文章:
142863 專用網絡的有效IP尋址(Valid IP Addressing for a Private Network)


圖 5.應用於專用適配器的IP地址示例。
6.        確認未在“默認網關”方框中,或者在“使用下列DNS服務器地址”下方,定義了任何值。
7.        單擊“高級”按鈕。
8.        在“ DNS”選項卡上,確認未定義任何值。同時確認清除了“在DNS中註冊此連接的地址”和“在DNS註冊中使用此連接的DNS後綴”複選框。
9.        在“WINS”選項卡上,確認未定義任何值。單擊“禁用TCP/IP上的NetBIOS”,如下方圖6所示。

圖 6. 確認未在“WINS”選項卡上定義任何值。
10.        當關閉了該對話框,您可能接收到如下提示:“此連接擁有一個空白的主WINS地址。您想繼續嗎?”如果您收到了該提示,單擊“是”。
11.        在羣集中的所有其它節點上,通過不同靜態IP地址完成步驟1至10。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#5
發表於 2007-3-30 13:32  資料 短消息
配置公用網絡適配器
注意:如果IP地址是通過DHCP獲取的,那麼如果不能訪問DHCP服務器,則可能無法接入羣集節點。由於這個原因,服務器羣集上的所有接口均要求靜態 IP地址。記住:羣集服務只能識別每個子網上的一個網絡接口。如果您需要Windows Server 2003中TCP/IP尋址的協助,請參見“聯機幫助”。
驗證連通性和名稱解析
要驗證專用和公用網絡正確地進行通信,查驗來自每個節點的所有IP地址。您必須可以在本地和遠程節點上查驗所有的IP地址。
要驗證名稱解析,使用節點的機器名稱而非IP地址,從客戶端查驗每一個節點。應該僅對公用網絡返回IP地址。您也許還想嘗試通過“PING –a”命令,反向查找IP地址。
驗證域成員
羣集中的所有節點必須是同一個域的成員,並可以訪問域控制器和DNS服務器。不能將其設定爲成員服務器或域控制器。與羣集一樣,您至少應該在相同的網絡區域擁有一個域控制器。基於高可用性,另一個域控制器也應該可用於消除單點故障。在本指南中,所有的節點都被設定爲成員服務器。
在某些實例中,節點可能部署於並未預先存在Microsoft® Windows NT® 4.0域控制器或Windows Server 2003域控制器的環境中。這種情景至少要求其中有一個羣集節點被設定爲域控制器。但是,在雙節點服務器羣集中,如果其中有一個節點是域控制器,那麼另一個節點也必須是一個域控制器。在四節點羣集實施過程中,沒有必要將全部四個節點都設定爲域控制器。然而,當遵照一個“最佳實踐”模型並至少擁有一個後備域控制器時,餘下的三個節點中至少應該有一個被設定爲域控制器。在設定羣集服務之前,必須使用DCPromo工具將其中一個節點提升爲域控制器。
在Windows Server 2003中位於DNS上的依賴性進一步要求,如果另一個支持動態更新和/或SRV記錄的DNS服務器不可用,每一個是域控制器的節點也必須是DNS服務器(建議採用活動目錄集成區域)。
在將羣集節點部署爲域控制器時,應該考慮以下問題:
•        如果雙節點羣集中有一個羣集節點是域控制器,另一個節點也必須是域控制器。
•        運行域控制器需要一定的開銷。一個空閒的域控制器在任何地方都會使用130到140 MB的RAM,包括維持羣集服務運行所需的內存。複製也會增加網絡流量,因爲這些域控制器必須在域中和域間同其它域控制器進行復制。
•        如果羣集節點是唯一的域控制器,那麼每個節點必須同時是DNS服務器。對於主DNS解析,它們必須相互指向對方,而對於備用解析,則必須指向自身。
•        森林/域中的第一個域控制器將承擔所有的操作主控角色(Operations Master Roles)。您可以將這些角色重新分配給任何節點。但是,如果有一個節點出了故障,該節點所承擔的操作主控角色(Operations Master Roles)將不可用。因此,建議您不要在任何羣集節點上運行操作主控角色(Operations Master Roles),其中包括架構主控(Scheme Master)、域命名主控(Domain Naming Master)、相關 ID主控(Relative ID Master)、 PDC仿真主控(PDC Emulator)和基礎結構主控(Infrastructure Master)。這些功能不能進行羣集以便通過故障轉移實現高可用性。
•        由於資源限制,在節點同時是域控制器的情況下,對Microsoft® SQL Server ™或Microsoft® Exchange Server等其它應用程序進行羣集處理可能無法達到最佳效果。在部署前,該配置必須在實驗室環境中進行全面的測試。
由於製作羣集節點域控制器所涉及的複雜性和開銷,建議所有節點都應該是成員服務器。
設置羣集用戶帳戶
羣集服務需要一個屬於可運行羣集服務的每個節點上的本地管理員(Local Administrators)組成員的域用戶帳戶。因爲安裝需要用戶名和密碼,所以該用戶帳戶必須在配置羣集服務前予以創建。該用戶帳戶只能專門用於運行羣集服務,而不能屬於個人。
注意:羣集服務帳戶不需要一定是域管理員(Domain Administrators)組的成員。基於安全原因,建議不要授予羣集服務帳戶域管理員權利。
羣集服務帳戶需要下列權利以便在羣集的所有節點上正確地發揮作用。“羣集配置嚮導”(Cluster Configuration Wizard)自動授予以下權利:
•        充當操作系統的一部分
•        調整某個過程的內存配額
•        備份文件和目錄
•        增加計劃優先級
•        作爲服務登錄
•        還原文件和目錄
設置羣集用戶帳戶
1.        單擊“開始”,指向“所有程序”,指向“管理工具”,然後單擊“活動目錄用戶和計算機”。
2.        如果域還未展開,單擊加號(+)將其展開。
3.        右擊“用戶”,指向“新建”,然後單擊“用戶”。
4.        鍵入羣集名稱,如下方圖7所示,然後單擊“下一步”。
圖 7. 鍵入羣集名稱。
5.        將密碼設置設定爲“用戶不能更改密碼”和“密碼永不過期”。單擊“下一步”,然後單擊“完成”創建該用戶。
注意:如果您的管理安全策略不允許使用永不過期的密碼,您必須在密碼到期前,在每個節點上重續密碼並更新羣集服務配置。附加信息,請在Microsoft知識庫中參閱下方文章:
305813 如何更改羣集服務帳戶密碼(How to Change the Cluster Service Account Password)
6.        在“活動目錄用戶和計算機”插件的左窗格中,右擊“羣集”,然後在快捷菜單上單擊“屬性”。
7.        單擊“將成員添加到組”。
8.        單擊“管理員”,然後單擊“確定”。這將給予新用戶帳戶在該計算機上的管理特權。
9.        退出“活動目錄用戶和計算機”插件。

設置共享磁盤
警告:爲了避免破壞羣集磁盤,在其它節點上啓動操作系統前,確認至少在一個節點上安裝、配置和運行了Windows Server 2003。在完成羣集服務配置之前,所開啓的節點數不要超過一個,這一點至關重要。
要繼續的話,關閉所有節點。開啓共享存儲設備,然後開啓節點1。
關於仲裁磁盤
仲裁磁盤(quorum disk)用於存儲羣集配置數據庫檢查點以及協助管理羣集和維持一致性的日誌文件。建議遵照以下仲裁磁盤設置步驟:
•        創建一個最小50 MB的邏輯驅動器用作仲裁磁盤。對於NTFS,最佳的大小爲500 MB。
•        專門劃出一個單獨的磁盤作爲仲裁資源。
重要:仲裁磁盤故障可能導致整個羣集失效;所以,強烈建議您使用硬件RAID陣列上的一個卷。除了進行羣集管理外,不要使用仲裁磁盤執行其它任務。
仲裁資源在羣集運作中扮演着關鍵的角色。在每個羣集中,一個單一的資源被分配作爲仲裁資源。仲裁資源可以是具備下列功能的任何物理磁盤(Physical Disk)資源:
•        將羣集註冊表複製到服務器羣集中的其它節點上。在每個節點上,羣集註冊表默認保存在:%SystemRoot%\Cluster\Clusdb。而後,羣集註冊表被複制到仲裁驅動器的MSCS\Chkxxx.tmp文件中。這些文件互爲副本。MSCS\Quolog.log文件是一個維持記錄所有針對檢查點文件的更改的事務日誌。這意味着,脫機的節點可以在重新加入羣集時追加這些更改。
•        如果羣集節點間失去了通信,質詢響應協議將啓動以防止出現“裂腦”狀況。在這種情況中,仲裁磁盤資源的所有者變成羣集及所有資源的唯一所有者。所有者隨之爲客戶端提供資源。當擁有仲裁磁盤的節點不正確地運作時,正常的節點將通過仲裁獲得設備的所有權。更多信息,請在Microsoft知識庫中參閱以下文章:
309186 羣集服務如何在共享總線上獲得磁盤的所有權(How the Cluster Service Takes Ownership of a Disk on the Shared Bus)
在羣集服務安裝過程中,您必須爲仲裁磁盤提供驅動器盤符。常用的標準盤符爲“Q”,本例中亦採用“Q”盤符。

配置共享磁盤
1.        確認僅開啓了一個節點。
2.        右擊“我的電腦”,單擊“管理”,然後展開“存儲”。
3.        雙擊“磁盤管理”。
4.        如果您連接了一個新的驅動器,將自動開啓“寫入簽名和更新磁盤嚮導”。如果出現該向導,單擊“下一步”,完成嚮導的各個步驟。
注意:該向導自動將磁盤設爲動態。要將磁盤復位到基本狀態,右擊“磁盤n”(n在此處指您正在設定的磁盤),然後單擊“還原基本磁盤”。
5.        右擊“未分配的磁盤空間”。
6.        單擊“新分區”。
7.        將啓動“新建分區嚮導”,單擊“下一步”。
8.        選擇“主分區”的分區類型,單擊“下一步”。
9.        默認將分區設爲最小。單擊“下一步”。(建議採用多個邏輯磁盤,而不是在一個磁盤上採用多個分區。)
10.        使用下拉框更改驅動器盤符。使用在字母表上比默認列舉的字母更靠後的驅動器盤符。通常,驅動器盤符“Q”可以用於仲裁磁盤,而“R”、“S”等字母則用於數據磁盤。更多信息,請在Microsoft知識庫中參閱下方文章:
318534 關於在服務器羣集上分配驅動器號的最佳實踐(Best Practices for Drive-Letter Assignments on a Server Cluster)
注意:如果您正在計劃使用卷裝載點,不要對磁盤分配驅動器號。更多信息,請在Microsoft知識庫中參閱下方文章:
280297 如何在羣集服務器上配置卷裝載點(How to Configure Volume Mount Points on a Clustered Server)

11.        使用NTFS格式化分區。在“卷標”方框中,鍵入該磁盤的名稱。例如:“驅動器Q”,如下方圖8所示。關鍵是要對共享磁盤分配驅動器標籤,因爲在還原磁盤時這會大大減少故障排除時間。

















圖 8. 對共享磁盤分配驅動器標籤至關重要。
如果您正在安裝64位版本的Windows Server 2003,確認所有的磁盤均格式化爲MBR。全局分區表(Global Partition Table,GPT)磁盤不能作爲羣集磁盤得到支持。更多信息,請在Microsoft知識庫中參閱下方文章:
284134 服務器羣集不支持GPT共享磁盤(Server Clusters Do Not Support GPT Shared Disks)
確認所有的共享磁盤均格式化爲NTFS並指派爲MBR Basic。

驗證磁盤訪問與功能
1.        啓動“Windows Explorer”。
2.        右擊一個共享磁盤(比如:“驅動器Q:\”),單擊“新建”,然後單擊“文本文檔”。
3.        確認您可以順利寫入磁盤,並創建了文件。
4.        選擇所創建的文件,然後按“Del”鍵,將其從羣集磁盤刪除。
5.        對所有羣集磁盤重複步驟1至4,確認可以從第一個節點正確地訪問它們。
6.        關閉第一個節點,開啓第二個節點,並重復步驟1至4,驗證磁盤訪問和功能。分配驅動器號,以便與相對應的驅動器標籤相匹配。對任何附加節點重複相同的步驟。確認所有節點都可以從磁盤讀取和寫入,關閉除第一個節點以外的所有節點,然後繼續閱讀本白皮書。
配置羣集服務
您必須在安裝的第一個階段提供所有初始配置信息。該步驟是通過使用“羣集配置嚮導”來完成的。

如下方流程圖所示,“Form(形成)”(創建一個新羣集)和“Join(加入)”(添加節點)所採取的路徑有所不同,但是它們共有一些相同的設置頁面,即“憑證登錄”、“分析”以及“重新分析並啓動服務”。而在下列頁面上則有少許不同:“歡迎”、“選擇計算機”和“羣集服務帳戶”。在本課的下面兩個部分中,您將執行反映所有這些配置路徑的嚮導頁面。當您完成了所有的步驟,本白皮書將在第三部分中詳細描述“分析”和“重新分析並啓動服務”頁面,以及這些屏幕所提供的信息的具體意思。


















注意:在節點1上進行羣集服務配置的過程中,您必須關閉所有其它節點,並開啓所有共享存儲設備。
配置第一個節點
1.        依次單擊“開始”、“所有程序”和“管理工具”,然後單擊“羣集管理器”。
2.        當出現“打開羣集連接嚮導”提示時,在“執行”下拉列表中,單擊“創建新羣集”,如下方圖9所示。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#6
發表於 2007-3-30 13:33  資料 短消息
圖 9. “執行”下拉列表。
3.        確認您具有配置羣集所必需的前提條件,如下方圖10所示。單擊“下一步”。

圖 10. 前提條件列表屬於“新建服務器羣集嚮導歡迎”頁面的一部分。
4.        鍵入羣集的唯一NetBIOS名稱(最多15個字符),然後單擊“下一步”。(在下方圖11所示的例子中,羣集被命名爲“MyCluster(我的羣集)”)建議遵守DNS命名規則。更多信息,請在Microsoft知識庫中參閱下列文章:
163409 NetBIOS後綴(NetBIOS名稱的第16個字符)“NetBIOS Suffixes (16th Character of the NetBIOS Name)”
254680 DNS名稱空間規劃(DNS Namespace Planning)














圖 11. 建議在命名羣集時遵守DNS命名規則。
5.        如果您在本地登錄一個不屬於“具有本地管理特權的域帳戶”的帳戶,嚮導將提示您指定一個帳戶。羣集服務不會使用該帳戶進行啓動。
注意:如果您擁有正確的憑證,步驟5所提到的提示,如圖12所示,可能不會出現。















圖 12. “新建服務器羣集嚮導”提示您指定一個帳戶。

6.        由於可能對羣集進行遠程配置,因此您必須確認或鍵入將要作爲第一個節點創建羣集的服務器的名稱,如下方圖13所示。單擊“下一步”。














圖 13. 選擇將要作爲羣集中第一個節點的計算機名稱。

注意:“安裝”嚮導可以驗證所有的節點是否都可以看到共享磁盤。在複雜的存儲區域網絡中,磁盤的目標識別符(TID)有時可能有所不同,而且“安裝”程序可能錯誤地檢測到磁盤配置對其無效。要解決這個問題,您可以單擊“高級”按鈕,然後單擊“高級(最小)配置”。附加信息,請在Microsoft知識庫中參閱下方文章:
331801 羣集安裝程序在您添加節點時可能不工作(Cluster Setup May Not Work When You Add Nodes)






7.        下方圖 14顯示“安裝”程序現在將分析節點,查找可能導致安裝出現問題的硬件或軟件問題。檢查所有警告或錯誤信息。您還可以單擊“詳細信息”按鈕,瞭解有關每個警告或提示的詳細信息。













圖 14. “安裝”程序分析節點,查找可能存在的硬件或軟件問題。
8.        鍵入唯一的羣集IP地址(本例爲:172.26.204.10),然後單擊“下一步”。
如下方圖15所示,“新建服務器羣集嚮導”通過使用子網掩碼選擇正確的網絡,自動與其中一個公用網絡關聯羣集IP地址。羣集IP地址只能用於管理,而不能用於客戶端連接。










圖 15. “新建服務器羣集嚮導”自動與其中一個公用網絡關聯羣集IP地址。

9.        鍵入在預安裝時創建的羣集服務帳戶的“用戶名”和“密碼”。(在下方圖16的例子中,用戶名爲:“Cluster(羣集)”)在“域”下拉列表中選擇域名,然後單擊“下一步”。

這時,“羣集配置嚮導”將驗證用戶帳戶和密碼。















圖 16. 嚮導提示您提供在預安裝時所創建的帳戶。

10.        檢查“摘要”頁面,如下方圖17所示,確認所有將用於創建羣集的信息均準確無誤。如果需要,您可以使用仲裁按鈕,更改由默認自動選擇的磁盤指派的仲裁磁盤。
本屏幕上所顯示的摘要信息可用於在出現災難恢復狀況時,重新配置羣集。建議您保存並打印一份硬拷貝,與服務器上的更改管理日誌保持一致。
注意:“仲裁”按鈕也可用於指定一個多數節點集(Majority Node Set,MNS)仲裁模型。在您創建MNS羣集時,這是主要的配置區別之一。















圖 17. 建議採用的“羣集配置”頁面。
11.        檢查所有在羣集創建過程中遇到的警告或錯誤。具體操作是單擊加號查看更多信息,然後單擊“下一步”。出現在“創建羣集”頁面的警告和錯誤如圖18所示。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#7
發表於 2007-3-30 13:34  資料 短消息
圖 18. 出現在“創建羣集”頁面上的警告和錯誤。

12.        單擊“完成”,結束安裝。下方圖19顯示最終的步驟。













圖 19. 設置一個新的服務器羣集的最終步驟。

注意:要查看詳細的摘要,單擊“查看日誌”按鈕,或者查看保存在該位置:%SystemRoot%\System32\LogFiles\Cluster\ClCfgSrv.Log的文本文件。

驗證羣集安裝
使用“羣集管理器”(CluAdmin.exe),在節點1上驗證羣集服務安裝。
驗證羣集安裝
1.        依次單擊“開始”、“所有程序”和“管理工具”,然後單擊“羣集管理器”。
2.        確認所有的資源均順利地實現了聯機,如下方圖20所示。










圖 20. “羣集管理器”驗證所有的資源均順利地實現聯機。

注意 原則上,不要將任何東西放到羣集組中,不要從羣集組中取出任何東西,也不要使用羣集組中的任何東西執行羣集管理以外的操作。

配置第二個節點
在另一個節點上安裝羣集服務所需的時間要比花在第一個節點上的時間少。“安裝”程序基於第一個節點的配置,在第二個節點上配置羣集服務網絡設置。與此同時,您還可以通過遠程操作爲羣集添加多個節點。
注意:對於本部分,開啓節點1和所有的共享磁盤,然後開啓所有其它節點。這時,羣集服務將控制對於共享磁盤的訪問,以便杜絕任何可能破壞卷的機會。
1.        在節點1上打開“羣集管理器”。
2.        單擊“文件”,單擊“新建”,然後單擊“節點”。
3.        將啓動“添加羣集計算機嚮導”,單擊“下一步”。
4.        如果您沒有通過正確的憑證進行登錄,將要求您指定一個對羣集中所有節點具有管理權利的域帳戶。
5.        輸入您要將其添加到羣集的節點的機器名稱,單擊“添加”。重複該步驟,如下方圖21所示,添加您想要的其它節點。當您添加完了所有的節點,單擊“下一步”。













圖 21. 對羣集添加節點。

6.        “安裝”嚮導將對所有節點執行分析,以便確認它們得到了正確的配置。
7.        鍵入用於啓動羣集服務的帳戶密碼。
8.        檢查所顯示的用於確認的摘要信息。摘要信息將用於在其它節點加入羣集時對其進行配置。
9.        檢查羣集創建過程中遇到的所有警告或錯誤,然後單擊“下一步”。
10.        單擊“完成”,結束安裝。

安裝後的配置
心跳配置
現在,每個節點上的網絡都已得到了正確的配置,而且羣集服務也已配置完畢,這時您需要配置網絡角色,以便定義各個網絡在羣集中的功能。這裏有一份“羣集管理器”中網絡配置選項的列表:
•        針對羣集應用啓用: 如果選定了該複選框,羣集服務將使用該網絡。默認對所有網絡選定該複選框。
•        僅用於客戶端訪問(公用網絡):如果您想讓羣集服務僅使用該網絡適配器與其它客戶端進行外部通信,那麼選擇該選項。該網絡適配器將不進行節點對節點通信。
•        僅用於內部羣集通信(專用網絡):如果您想讓羣集僅使用該網絡進行節點對節點通信,那麼選擇該選項。
•        所有通信(混合網絡):如果您想讓羣集服務使用該網絡適配器進行節點對節點通信和外部客戶端通信,那麼選擇該選項。默認對所有網絡選定該複選框。
本白皮書假定僅使用兩個網絡,並解釋如何將這兩個網絡分別作爲混合網絡和專用網絡進行配置。這是最常見的配置。如果您擁有可用的資源,建議使用兩個專門的冗餘網絡用於內部羣集通信。
配置心跳
1.        啓動“羣集管理器”。
2.        在左窗格中,單擊“羣集配置”,單擊“網絡”,右擊“專用”,然後單擊“屬性”。
3.        單擊“僅用於內部羣集通信(專用網絡)”,如下方圖22所示。













圖 22. 使用“羣集管理器”配置心跳。

4.        單擊“確定”。
5.        右擊“公用”,然後單擊“屬性”(如下方圖23所示)。
6.        單擊選定“針對羣集應用啓用該網絡”複選框。
7.        單擊“所有通信(混合網絡)”,然後單擊“確定”。











圖 23. “公用屬性”對話框。

心跳適配器優先化
配置完羣集服務如何應用網絡適配器的角色後,下一步是對內部羣集通信應用進行優先排序。這僅適用於兩個或兩個以上被配置爲節點對節點通信的網絡。屏幕右邊的優先級箭頭指定了羣集服務使用各個網絡適配器在節點間進行通信的先後順序。羣集服務總是嘗試使用列於首位的網絡適配器進行節點間的遠程過程調用(RPC)通信。只有當羣集服務無法使用第一個網絡適配器進行通信時,纔會使用列表上的下一個網絡適配器。
1.        啓動“羣集管理器”。
2.        在左窗格中,右擊羣集名稱(位於左上角),然後單擊“屬性”
3.        單擊“網絡優先級”選項卡,如下方圖24所示。
圖 24. “羣集管理器”中的“網絡優先級”選項卡。
4.        確認“專用”網絡列於最頂部。使用“上移”或“下移”按鈕,更改優先順序。
5.        單擊“確定”。
配置羣集磁盤
•        啓動“羣集管理器”,右擊您想從羣集刪除的任何磁盤,然後單擊“刪除”。
注意:默認狀態下,所有磁盤並不在相同的總線上,因爲系統磁盤將爲它們創建物理磁盤資源(Physical Disk Resources),並對其進行羣集。因此,如果節點擁有多條總線,可能列出的某些磁盤將無法用作共享存儲,例如:內部SCSI驅動器。應該從羣集配置刪除這些磁盤。如果您計劃對某些磁盤實施“卷裝載”(Volume Mount)點,您可能要刪除這些磁盤的當前磁盤資源,刪除驅動器號,然後創建一個未分配驅動器號的新的磁盤資源。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#8
發表於 2007-3-30 13:36  資料 短消息
仲裁磁盤配置
“羣集配置嚮導”自動選擇將作爲仲裁設備的驅動器,並將使用50 MB以上的最小分區。您可能要把自動選擇的磁盤更改爲您自己專門指派的仲裁磁盤。
配置仲裁磁盤
1.        啓動“羣集管理器”(CluAdmin.exe)。
2.        右擊位於左上角的羣集名稱,然後單擊“屬性”。
3.        單擊“仲裁”選項卡。
4.        在“仲裁資源”列表框中,選擇一個不同的磁盤資源。在下方圖25中,“仲裁資源”列表框中所選定的是“磁盤Q”。

圖 25. “仲裁資源”列表框。
5.        如果磁盤擁有的分區不止一個,單擊您要在其中保存羣集指定數據的分區,然後單擊“確定”。
附加信息,請在Microsoft知識庫中參閱下方文章:
Q280353 如何更改仲裁磁盤指定(How to Change Quorum Disk Designation)
創建一個啓動延遲
當出現所有的羣集節點均同時啓動並嘗試附加到仲裁資源的情況時,羣集服務可能無法啓動。例如:在發生電源故障後,同時對所有節點恢復電力時,可能出現這種情況。要避免這類情況的發生,增加或減少“顯示操作系統列表用時”設置。要找到該設置,單擊“開始”,指向“我的電腦”並右擊鼠標,然後單擊“屬性”。單擊“高級”選項卡,然後在“啓動與恢復”下方,單擊“設置”。

測試安裝
在“安裝”程序結束後,有好幾種驗證羣集服務安裝的方法。其中包括:
•        羣集管理器:如果僅完成了節點1的安裝,啓動“羣集管理器”,然後嘗試連接到羣集。如果已安裝了第二個節點2,在任意一個節點上啓動“羣集管理器”,然後確認第二個羣集顯示在列表上。
•        “服務”小程序:使用“服務”小程序確認羣集服務已顯示在列表上並已啓動。
•        事件日誌:使用“事件查看器”檢查系統日誌中的“ClusSvc”條目。您會看到有關確認羣集服務已經順利形成或加入一個羣集的條目。
•        羣集服務註冊表項:確認羣集服務安裝程序將正確的項寫入註冊表。您可以在HKEY_LOCAL_MACHINE\Cluster下找到許多註冊表設置。
•        單擊“開始”,單擊“運行”,然後鍵入“虛擬服務”名稱。確認您可以連接並看到資源。
測試故障轉移
驗證資源將執行故障轉移
1.        依次單擊“開始”、“程序”和“管理工具”,然後單擊“羣集管理器”,如下方圖26所示。











圖 26. “羣集管理器”窗口。

2.        右擊“磁盤組1”組,然後單擊“移動組”。該組及其所有資源將轉移到另一個節點。稍後,“磁盤F:、G:”將在第二個節點上實現聯機。在窗口中觀察該轉移。退出“羣集管理器”。

恭喜!您已經完成了所有節點上的羣集服務配置。服務器羣集已經完成可以運作了。您現在可以準備安裝羣集資源,比如:文件共享、打印機捲筒、諸如分佈式事務協調器(Distributed Transaction Coordinator)、DHCP、WINS等羣集識別服務、或者諸如Exchange Server或SQL Server等羣集識別程序。
附錄
高級測試
現在,您已經配置好了您的羣集並驗證了基本的功能和故障轉移,您可能想執行一系列的故障情境測試,來演示預期的結果,並確保羣集在發生故障時會正確地進行響應。並不是在每一次實施時都需要進行這種程度的測試,但是如果您剛開始接觸羣集技術,而且不熟悉羣集的響應方式,或者您正在自己的環境中實施一個新的硬件平臺,這將有助於進行深入的瞭解。所列出的預期結果是針對結合默認設置的乾淨羣集配置,並未考慮任何用戶自定義的故障轉移邏輯。這不是一個包含所有測試的完整列表,而順利完成這些測試並不能認爲已經得到了“許可”或準備好進行生產運作。這只是一個關於某些可執行的測試的示範列表。附加信息,請在 Microsoft知識庫中參閱下方文章:
197047 Microsoft羣集服務器上的故障轉移/故障恢復策略(Failover/Failback Policies on Microsoft Cluster Server)
測試:啓動“羣集管理器”,右擊一個資源,然後單擊“啓動故障”。該資源將進入故障狀態,然後將重新啓動並在同一節點上回到聯機狀態。
預期結果:資源將在相同的節點上返回聯機狀態
測試:在相同的資源上,再執行上方“啓動故障”測試三次。在第四次故障時,資源將對羣集中的另一個節點執行故障轉移。
預期結果:資源將針對羣集中的另一個節點實施故障轉移
測試:將所有資源轉移到一個節點上。啓動“計算機管理”,然後單擊“服務與應用程序”下方的“服務”,停止羣集服務。在另一個節點上啓動“羣集管理器”,確認所有資源均在該節點上正確地執行了故障轉移並返回聯機狀態。
預期結果:資源將針對羣集中的另一個節點實施故障轉移
測試:將所有資源轉移到一個節點上。在該節點上,單擊“啓動”,然後單擊“關閉”。這將關閉該節點。在另一個節點上啓動“羣集管理器”,然後確認所有資源均在該節點上正確地執行了故障轉移並返回聯機狀態。
預期結果:資源將針對羣集中的另一個節點實施故障轉移
測試:將所有資源轉移到一個節點上,然後按服務器前方的電源按鈕將其關閉。如果您有一臺符合ACPI(高級配置和電源接口)標準的服務器,該服務器將執行 “緊急關閉”功能進行關閉。在另一個節點上啓動“羣集管理器”,確認所有資源均在該節點上正確地執行了故障轉移並返回聯機狀態。有關“緊急關閉”的附加信息,請在Microsoft知識庫中參閱下列文章:
325343 教學文章:在Windows Server 2003中執行緊急關閉(HOW TO: Perform an Emergency Shutdown in Windows Server 2003)
297150 ACPI計算機上的電源按鈕可能強制執行緊急關閉(Power Button on ACPI Computer May Force an Emergency Shutdown)
預期結果:資源將針對羣集中的另一個節點實施故障轉移
警告:執行“緊急關閉”測試可能導致數據遭破壞和丟失。不要在生產服務器上執行該測試。
測試:將所有資源轉移到一個節點上,然後拔掉服務器的電源線模仿一個硬故障。在另一個節點上啓動“羣集管理器”,然後確認所有資源均在該節點上正確地執行了故障轉移並返回聯機狀態。
預期結果:資源將針對羣集中的另一個節點實施故障轉移
警告:執行硬故障測試測試可能導致數據遭破壞和丟失。這是一個極端測試。確認您已備份了所有關鍵數據,然後在您自己的磁盤上執行該測試。不要在生產服務器上執行該測試。
測試: 將所有資源轉移到一個節點上,然後拔掉該節點的公用網絡電纜。IP地址資源將失效,組將針對羣集中的另一個節點執行故障轉移附加信息,請在Microsoft知識庫中參閱下方文章:
286342 Windows Server 2003羣集中的網絡故障檢測與恢復(Network Failure Detection and Recovery in Windows Server 2003 Clusters)
預期結果:資源將針對羣集中的另一個節點實施故障轉移
測試:拔掉專用心跳網絡的網絡電纜。心跳流量將針對公用網絡執行故障轉移,同時不會執行其它故障轉移。如果發生了其它故障轉移,請參見本文檔前面有關“配置專用網絡適配器”的部分。
預期結果:不會進行其它任何故障轉移或資源故障轉移
SCSI驅動器安裝
本附錄提供一套針對SCSI驅動器安裝的一般性指導說明。如果SCSI硬盤供應商的指導說明與此處的指導說明相沖突,請遵照供應商所提供的指導說明。
硬件要求中所列的SCSI總線必須在安裝羣集服務器之前予以配置。配置涉及:
•        SCSI設備。
•        SCSI控制器和硬盤,以便其可以正確地運行於共享SCSI總線。
•        正確端接總線。共享SCSI總線必須在總線的每個終端上均擁有一個端接器。羣集的各個節點間可能擁有多條共享SCSI總線。
除了以下幾頁信息外,請參考您的SCSI設備製造商的文檔,或者可以向美國國家標準協會(American National Standards Institute,ANSI)索取SCSI規格說明。ANSI網站包含一個可用於搜索SCSI規格說明的目錄。
配置SCSI設備
共享SCSI總線上的每個設備都必須有一個唯一的SCSI標識號(ID)。由於多數SCSI控制器默認爲SCSI ID 7,因此配置共享SCSI總線包括將控制器上的SCSI ID號碼更改爲另一個號碼,比如:SCSI ID 6。如果共享SCSI總線上的磁盤不止一個,每個磁盤都必須擁有一個唯一的SCSI ID號碼。
端接共享SCSI總線
有幾種端接共享SCSI總線的方法,其中包括:
•        SCSI控制器
SCSI控制器具有可用於端接總線的內部軟端接,但是不推薦對羣集服務器使用該方法。如果通過該配置關閉一個節點,SCSI總線將被不正確地端接,而且不能正常地運作。
•        存儲盒
存儲盒也具有內部端接。如果存儲盒位於SCSI總線的末端,其內部端接可用於端接SCSI總線。應該將其關閉。
•        Y電纜
Y電纜可用於連接位於SCSI總線末端的設備。外部活動端接器隨後可以附加到Y電纜的一個分支,以便端接SCSI總線。該端接方法要求禁用或移除設備可能擁有的任何內部端接器。
圖 27 描繪應該如何對SCSI羣集進行物理連接。


















圖 27. SCSI羣集硬件配置示意圖。

注意:對於任何位於共享總線末端的設備,都必須禁用其內部端接。Y電纜和活動端接連接器均是推薦的端接方法,因爲即使節點未聯機時,它們也能提供端接。
存儲區域網絡的考慮事項
在Windows Server 2003服務器羣集中,有兩種基於光纖通道的存儲支持方法:仲裁環和交換架構。
重要:在對這兩類光纖通道實施進行評估時,閱讀供應商的文檔,並確定您瞭解每種實施的指定特性和限制。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#9
發表於 2007-3-30 13:37  資料 短消息
雖然 “Fibre Channel”(光纖通道)這一術語暗示了光纖技術的應用,但是也允許使用銅製同軸電纜進行互連。
仲裁環(FC-AL)
光纖通道仲裁環(Fibre Channel arbitrated loop,FC-AL)是一套相互連接形成一個單一環路的節點和設備集。FC-AL提供了一個能將多達126個設備連接形爲一個單一網絡的經濟的方法。通過SCSI,結合集線器配置的FC-AL服務器羣集最多可支持兩個節點。FC-AL如圖 7.15所示。
圖 7.15   FC-AL連接

FC-AL以相對靜態的配置爲雙節點和少量設備提供解決方案。環路上的所有設備共享介質,而且從一個設備傳輸到另一個設備的任何數據包都必須通過所有中間設備。
如果一個雙節點服務器羣集可以滿足您對可用性的需求,那麼FC-AL部署就具有以下幾個優勢:
•        成本費用相對較低。
•        環路可得到擴展以增加存儲(雖然不能添加節點)。
•        環路易於光纖通道供應商進行開發。
環路的劣勢是難以在組織中進行部署。由於環路上的每個設備均共享同一個介質,因此羣集中的整體帶寬變窄了。有些組織還可能受到126個設備上限的限制。
交換架構(FC-SW)
對於任何超過兩個節點的羣集,光纖通道交換架構(Fibre Channel switched fabric,FC-SW)是唯一受支持的存儲技術。在FC-SW中,設備在使用光纖通道交換器的多對多拓撲結構中進行連接(如圖 7.16所示)。
圖 7.16   FC-SW連接

當一個節點或設備同FC-SW中的另一個節點或設備進行通信時,通信源和通信對象建立起一個點對點連接(類似一個虛擬電路),並直接進行相互通信。架構本身路由選擇從通信源到通信對象的數據。在FC-SW中,並不對介質進行共享。任何設備都可以同其它任何設備進行通信,並以最高總線速度實現通訊。這是一個完全可伸縮的企業解決方案,因此強烈建議同服務器羣集進行部署。
FC-SW是SAN中所採用的主要技術。FC-SW的其它優勢包括:易於部署,可支持數百萬個設備,以及提供故障隔離和改換路由的交換機。另外,不存在像 FC-AL中的共享介質,允許更快地進行通信。但是,要知道FC-SW對於供應商來說難以開發,而且交換機的價格昂貴。供應商還必須考慮來自不同供應商或製造商的組件間的互操作性問題。
結合服務器羣集使用SAN
對於任何大型羣集部署,建議您使用存儲區域網絡(SAN)進行數據存儲。雖然較小的SCSI和獨立光纖通道存儲設備可以隨服務器羣集一起運作,但是SAN提供高級容錯能力。
SAN是一套連接到常規通信和數據傳輸基礎結構(在Windows Server 2003羣集中爲FC-SW)的相互連接的設備(比如:磁盤和磁帶)和服務器。SAN允許多個服務器接入存儲池,同時任何服務器都可以在其中潛在地訪問任何存儲單元。
本部分中的信息對配合您的Windows Server 2003羣集使用SAN技術進行了概述。有關在上部署服務器羣集的附加信息,請參見Windows羣集:位於[url]http://www.microsoft.com/windows/reskits/webresources[/url]的Web資源頁面上的“存儲區域網絡”鏈接。
注意:提供SAN架構組件和軟件管理工具的供應商擁有針對構建、配置、監控和管理SAN架構的廣泛的工具。聯繫您的SAN供應商,瞭解有關針對您的特殊SAN解決方案的詳細信息。
SCSI復位
Windows服務器羣集的早期版本假定對於共享磁盤的所有通信應作爲一個獨立的SCSI總線。該做法略具破壞性,並且沒有利用光纖通道的更高級的特性來提高仲裁性能和減少通信中斷。
Windows Server 2003中的一個關鍵改進是羣集服務發出一個命令用以打斷一個RESERVATION,而StorPort驅動程序可以針對光纖通道拓撲結構上的磁盤執行目標或設備復位。在Windows 2000服務器羣集中,整個總線範圍的SCSI RESET(復位)得到了發佈。這導致總線上的所有設備被斷開連接。當SCSI RESET被髮布時,很多時間被花在復位可能無需進行復位的設備上,比如:CHALLENGER節點可能已經擁有的磁盤。
Windows 2003中的復位按照以下順序進行:
1. 目標邏輯單元號碼( LUN)
2. 目標SCSI ID
3. 整個總線範圍的SCSI RESET
      
        注意
        目標復位需要主機總線適配器(HBA)驅動程序中的功能。驅動程序必須是針對StorPort而不是SCSIPort編寫的。使用SCSIPort的驅動程序將如同在Windows 2000中使用Challenge和Defense一樣。聯繫HBA製造商,確定其是否支持StorPort。
      
SCSI命令
羣集服務使用下列SCSI命令:
•        SCSI保留:該命令由主機總線適配器或控制器發出,用於維持SCSI設備的所有權。被保留的設備拒絕所有來自其它主機總線適配器的命令,除了最初對其進行保留的主機總線適配器,即發起者。如果發出了一個總線範圍的SCSI復位命令,保留將散失。
•        SCSI釋放:該命令由擁有所有權的主機總線適配器發出;釋放SCSI設備,以便讓其它主機總線適配器對其進行保留。
•        SCSI復位:該命令中斷目標設備上的保留。有時該命令大體上指“總線服務”。
相同的控制代碼也用於光纖通道。這些參數在下列伴隨文章中予以定義:
309186 羣集服務如何獲得共享總線上磁盤的所有權(How the Cluster Service Takes Ownership of a Disk on the Shared Bus)
317162 支持的光纖通道配置(Supported Fibre Channel Configurations)
以下部分概述一些直接影響服務器羣集部署的SAN概念。
HBA
主機總線適配器(HBA)是將羣集節點連接到SAN的接口卡,其連接方法類似於網絡適配器將服務器連接到典型的Ethernet網絡的方式。但是,HBA 併網絡適配器更加不容易配置(除非HBA由SAN供應商預配置)。所有節點中的HBA必須是完全一致的,而且必須採用相同的驅動程序和固件版本。
分區和LUN屏蔽
分區和LUN屏蔽是SAN部署的基礎,尤其是它們涉及Windows Server 2003羣集部署。
分區
許多設備和節點都可以附加到SAN。由於數據保存在一個單一的“cloud”(存儲雲)或存儲實體中,控制哪些主機可以接入特定設備是很重要的。區域劃分允許管理員在邏輯卷中對設備進行分區,從而將設備保留在一個卷中以便爲服務器羣集所用。這意味着,邏輯存儲卷中羣集節點和設備間的所有交互具備隔離在區域邊界內;而其它SAN的非羣集成員則不會受羣集行爲的影響。
圖 7.17對兩個SAN區域進行邏輯描述(A區域和B區域),每個區域均包含一個存儲控制器(分別爲S1和S2)
圖 7.17   分區

在該部署中,節點Node A和節點B可從存儲控制器S1訪問數據,但節點節點C不可以。節點C可以從存儲控制器S2訪問數據。
分區需要在硬件層次進行實施(結合控制器或交換機),而不能通過軟件來實現。主要的原因是:分區也是一個針對基於SAN的羣集的安全機制,因爲未經授權的服務器無法訪問區域內的設備(訪問控制由架構中德交換機來執行,因此主機適配器無法訪問未經配置的設備)。如果通過軟件形式進行分區,如果軟件組件出現故障,羣集將無法得到安全保障。
除了提供羣集安全性外,分區還對給定SAN環境中的流量進行了限制。端口間的流量只被路由選擇到位於相同區域的架構段中。
頂部
llllyyyymmmm
註冊用戶
Rank: 2



UID 1753
精華 0
積分 85
帖子 10
貢獻 85 點
瑞普金幣 255 點
閱讀權限 10
註冊 2006-8-23
狀態 離線
       
#10
發表於 2007-3-30 13:39  資料 短消息
HBA
主機總線適配器(HBA)是將羣集節點連接到SAN的接口卡,其連接方法類似於網絡適配器將服務器連接到典型的Ethernet網絡的方式。但是,HBA 併網絡適配器更加不容易配置(除非HBA由SAN供應商預配置)。所有節點中的HBA必須是完全一致的,而且必須採用相同的驅動程序和固件版本。
分區和LUN屏蔽
分區和LUN屏蔽是SAN部署的基礎,尤其是它們涉及Windows Server 2003羣集部署。
分區
許多設備和節點都可以附加到SAN。由於數據保存在一個單一的“cloud”(存儲雲)或存儲實體中,控制哪些主機可以接入特定設備是很重要的。區域劃分允許管理員在邏輯卷中對設備進行分區,從而將設備保留在一個卷中以便爲服務器羣集所用。這意味着,邏輯存儲卷中羣集節點和設備間的所有交互具備隔離在區域邊界內;而其它SAN的非羣集成員則不會受羣集行爲的影響。
圖 7.17對兩個SAN區域進行邏輯描述(A區域和B區域),每個區域均包含一個存儲控制器(分別爲S1和S2)
圖 7.17   分區

在該部署中,節點Node A和節點B可從存儲控制器S1訪問數據,但節點節點C不可以。節點C可以從存儲控制器S2訪問數據。
分區需要在硬件層次進行實施(結合控制器或交換機),而不能通過軟件來實現。主要的原因是:分區也是一個針對基於SAN的羣集的安全機制,因爲未經授權的服務器無法訪問區域內的設備(訪問控制由架構中德交換機來執行,因此主機適配器無法訪問未經配置的設備)。如果通過軟件形式進行分區,如果軟件組件出現故障,羣集將無法得到安全保障。
除了提供羣集安全性外,分區還對給定SAN環境中的流量進行了限制。端口間的流量只被路由選擇到位於相同區域的架構段中。
LUN屏蔽
LUN是SAN中所定義的邏輯磁盤。服務器羣集看到LUN並將其認作物理磁盤。LUN屏蔽是在控制器層面執行的,允許您定義LUN與羣集節點間的關係。存儲控制器通常提供創建LUN層次的訪問控制的方法,用以允許給定LUN接入一個或更多的主機。通過在存儲控制器上提供該訪問控制,控制器本身可以對設備強加訪問策略。
LUN屏蔽提供了比分區更加細微的安全性,因爲LUN提供了端口層面的分區方法。例如:許多SAN交換機允許重疊的區域,從而可以使一個存儲控制器位於多個區域中。多個區域中的多個羣集可以共享這些區域中的控制器上的數據。圖 7.18描述了這類情景。
圖 7.18   多個區域中的存儲控制器

A羣集所用的LUN可以從B羣集屏蔽或隱藏,從而只有授權用戶纔可以訪問共享存儲控制器上的數據。
Windows Server 2003羣集和SAN的綜合部署要求
下方列表重點列出了在綜合部署服務器羣集和SAN存儲解決方案時,需要遵守的一些部署要求。有一份白皮書提供了有關結合服務器羣集使用SAN的更完整的信息,請參見Windows羣集:位於[url]http://www.microsoft.com/windows/reskits/webresources[/url]的Web資源頁面 Resources page 上的存儲區域網絡(Storage Area Networks)鏈接。
SAN上的每個羣集都必須在其自己的區域中進行部署。羣集用以保護磁盤訪問的機制可對相同區域內的其它羣集造成負面影響。通過使用分區將羣集流量從其它節點或非節點流量孤立出來,就不存在相互干擾的機會。
位於一個單一節點中的所有HBA必須是同一種類型,並且具有相同的固件版本。許多存儲和交換機供應商要求相同區域上——有時必須是在相同架構中——的所有HBA共享這些特性。
羣集中的所有存儲設備的驅動程序和HBA設備的驅動程序必須具有相同的軟件版本。
從來不要允許多個節點接入相同的存儲設備,除非它們位於相同的羣集中。
從來不要將磁帶設備放在羣集磁盤存儲設備所在的同一個區域。磁帶設備可能會誤解總線休眠,並在不恰當的時候(如在大型備份過程中)進行倒帶。
針對結合Windows Server 2003服務器羣集部署SAN的指導方針
除了上一部分所討論的SAN要求外,強烈建議在服務器羣集部署中遵照下列實踐:
在一個高度可用的存儲架構中,您需要通過多個HBA部署羣集的服務器。在這些情況中,始終載入多路徑驅動程序軟件。如果I/O子系統看到兩個HBA,會將其假定爲不同的總線,並列舉所有的設備,好像它們是每條總線上的不同設備。同時,主機看到針對相同磁盤的多條路經。載入多路徑驅動程序的失敗將禁用第二個設備,因爲操作系統將其所看到的認爲是具有相同簽名的兩個獨立磁盤。
不要將羣集磁盤的硬件快照暴露回相同羣集中的節點。硬件快照必須進入服務器羣集以外的服務器。許多控制器提供控制器層面的快照,其可作爲完全孤立的LUN 暴露於羣集。當多個設備擁有相同的簽名時,羣集性能會下滑。如果快照通過原始磁盤聯機暴露回節點,I/O子系統會嘗試重寫簽名。然而,如果快照暴露於羣集中的另一個節點,羣集服務不會將其識別爲一個不同的磁盤,而後果可能是數據遭破壞。雖然這不是一個特定的SAN問題,但是提供該功能的控制器通常被部署於 SAN環境中
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章