VMware虛擬化之VSA(vSphere Storage Appliance)羣集(二) 故障恢復詳測

VMware虛擬化

VSAvSphere Storage Appliance)羣集故障恢復詳測

在上一篇文檔中,曾詳細的介紹了VSA羣集的部署及安裝全過程,以及安裝過程中可能會遇到的一些問題及對應的解決方法,本篇將介紹VSA羣集的容災及故障恢復情況。部署一套環境,不能說是安裝完就完事了,肯定要對故障發生時的恢復做一定的測試,才能更好的理解整個平臺的實用效果。

 

八、故障恢復

在之前的文檔中曾有說明,我們的實驗採用的是三主機的結構,但不論是雙主機還三主機結構,都僅能夠對單節點故障進行恢復,這個原因,當了解了VSA的整個羣集結構就會很明白了,也正是因此,VSA羣集只有雙主機和三主機兩種部署結構模式。下圖爲VSA羣集三主機結構拓撲圖:

其中:標示IP地址的圖標爲三臺ESXi物理主機,VSA-0VSA-1VSA-2爲三臺ESXi主機內構建的用於發佈NFS共享磁盤的SUSE Linux虛擬機,VSADs(淺藍色圖標)爲每個VSA虛擬機分別創建的兩個共享磁盤,而每兩個VSA虛擬機採用RAID1的模式實現相互冗餘共同提供兩個VSADs(灰色圖標)鏡像模式的共享磁盤,最後共提供三個鏡像模式共享磁盤。這樣,其中任何一臺物理主機或者虛擬機斷電或者宕機,也不會影響到共享磁盤的VSADs的正常使用。這樣的容災模式是非常安全的。

1.單節點斷電故障恢復操作

這裏我們已經將10.15.20.103這臺主機電源拔下,當前此主機處於斷電狀態時,VSA羣集狀態便如下圖:

    注:主機在斷電之後,對應的部分共享存儲盤處於已降級狀態,同時在映射拓撲中狀態也會有所改變。

我們給斷電的主機重新加電並啓動,在正常啓動完成後,當VSA羣集檢測到該主機信號後,會立即對羣集存儲進行恢復,恢復羣集及存儲狀態所需時間大約爲5分鐘左右。恢復後即爲下圖(消除了已降級狀態):

2.單節點主機癱瘓故障及替換恢復操作

這裏模擬了10.15.20.103這臺主機癱瘓故障,主機由於硬件故障等原因癱瘓,已經斷電且不能在羣集中運行,需要在維護該主機後或通過備用物理機來替換該主機時,VSA羣集的狀態會出現如下圖變化:

    要說明的是,如果主機故障導致系統崩潰,或者使用新裝好ESXi的備用機替換故障主機時,該如何操作呢?參考下面的方法,就能完成替換主機:

這裏我們需要先準備好替換的備用ESXi主機,該ESXi主機的版本需要與VSA羣集中的其他主機版本相同,在準備好替換的主機後,將新的主機連接進入vCenter,但不要手動將該主機加入VSA羣集中,

vCenter中的VSA Manager控制面板中的“設備”選項卡中,我們可以看到故障主機對應設備狀態已經是“脫機”狀態,右鍵單擊此“脫機”狀態的設備,然後選擇“替換設備”,如下圖:

選擇了“替換設備”後,會彈出設備替換操作會話窗口,按如下圖示方法進行操作:

 

此處,便開始設備替換的安裝操作,會爲新的ESXi主機自動安裝VSA羣集。

自動安裝VSA羣集的時間約爲30分鐘左右,根據主機的配置以及已佔用資源的不同,所需時間可能會有差異,安裝好之後,VSA羣集狀態恢復如下圖:

注:我們看到VSA羣集的數據存儲狀態依然是已降級狀態,這是因爲替換上來的主機,還沒有完成共享磁盤配置,而此配置,也是由VSA羣集自動完成的。

在爲新替換的ESXi主機安裝完VSA羣集後,羣集會自動開始恢復共享磁盤的配置,在vCenter的任務欄中,我們會看到如下圖的任務正在進行:

 

該恢復操作包含兩個此任務,完成此配置的恢復,大約需要7~9小時的時間不等,而根據主機配置以及已使用資源的不同,時間可能會有差異。

配置恢復完成後,VSA羣集即恢復爲正常狀態。

 

注意:在自動安裝的VSA羣集,是默認不開啓vSphere DRS功能的,如果在使用過程中因爲需要開啓了vSphere DRS功能,則在做故障切換或者替換設備時,需要暫時關閉該功能,否則故障切換可能會因爲資源池的原因出現錯誤。設置開啓及關閉vSphere DRS功能時,在vCenter中右鍵單擊“VSA HA cluster”羣集,然後選擇“編輯設置”後出現設置會話框,詳情設置如下圖:

    至此,VSA羣集的故障恢復詳測結束。如有疑問歡迎投稿及聯繫本人。

 注:本文章PDF文檔已上傳至51CTO下載中心,鏈接地址:http://down.51cto.com/data/751543

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章