華爲磁陣Sx900故障硬盤手動剔除的方法/風險硬盤更換方法

以下內容爲公司的設備維保廠商提供給我的,原因是硬盤有故障,但未發生重構,所以需要手動操作讓熱備盤頂替故障盤。

我在OceanStor S3900上進行了操作(開啓ssh,進入命令行終端進行操作),很順利。本文有所更改,部分圖片重新進行了截取。

風險硬盤更換操作指導

執行命令showupgradepkginfo -t 1查看版本信息,根據設備版本(Package Version),確認風險硬盤的更換方法。

showupgradepkginfo

版本 實施方法
V100R002C00SPCh00
V100R002C01SPCh00
V100R005C00SPC700及之後的版本
V100R005C01SPC700及之後的版本
V100R005C02所有版本
按方法一實施風險硬盤更換
V100R001所有版本
V100R002C00SPCh00之前所有版本
V100R002C01SPCh00之前所有版本
V100R005C00SPC700之前的版本
V100R005C01SPC700之前的版本
按方法二實施風險硬盤更換

說明:V100R002版本依次爲V100R002C00SPC001, SPC002…V100R002C00SPC015, SPCg00, SPCh00

V100R005版本依次爲V100R005C00SPC002, SPC003,SPC400…SPC600, SPC700,SPC800,SPC900

方法一

操作步驟

步驟 1:登錄命令行,輸入developer,按照提示輸入密碼debug@storage。

步驟 2:執行命令showdisk -logic命令,確認需要更換的風險盤框號和槽位號。Disk Location爲硬盤的框號和槽位號。

showdisk

步驟 3:執行命令simudiskimpendfail -e enclosureid -s slotid。其中enclosureid爲硬盤的框號,slotid爲硬盤的槽位號。以Disk Location爲(1,0)爲示例,則執行命令simudiskimpendfail -e 1 -s 0,執行該命令後,系統會產生該硬盤即將失效的告警。

步驟 4:執行後,硬盤會自動進行預拷貝,將數據拷貝到熱備盤。通過命令showdisk -e enclosureid -s slotid查詢Precopying的進度,等待硬盤的狀態變爲Reconstruced狀態,即可正常進行故障盤更換。

步驟 5: 硬盤更換後,再查看硬盤的重構和回拷的狀態。

注意:

更換硬盤時,同一套存儲系統在同一時間僅能更換一塊保險箱硬盤。

更換保險箱盤時會出現“保險箱盤故障”的告警。

方法二

根據硬盤的槽位信息和邏輯類型和邏輯狀態進行更換,詳細更換方法,請參考如下表格進行選擇。

槽位 showdisk -logic查詢結果 更換方法
保險箱槽位 Logic Type爲Free的硬盤 參考2.1進行更換
非保險箱槽位 Logic Type爲Free的硬盤 參考2.2進行更換
非保險箱槽位 Logic Status爲Free spare的盤 參考2.3進行更換
非保險箱槽位 Logic Type爲Member盤 參考2.4進行更換
保險箱槽位 Logic Type爲Member盤 參考2.5進行更換

說明:針對Logic Status爲Used spare的硬盤,需要等待重構到該槽位的硬盤更換後,硬盤會自動釋放爲Logic Status爲Free spare或者Logic Type爲Free的硬盤。

2.1 更換非RAID組成員盤的保險箱盤

操作步驟

步驟 1:確認風險硬盤爲保險箱盤(即系統盤,如下圖紅色框標識,位於控制框的前四個槽位)。

以2U24盤位控制框保險箱盤的位置爲例:

2U24盤位控制框保險箱盤位置示意圖

以4U24盤位控制框保險箱盤的位置爲例:

4U24盤位控制框保險箱盤位置示意圖

如圖所示,槽位號爲0,1,2,3且邏輯狀態爲Free的保險箱盤:

保險箱盤

步驟 2:選擇一塊風險盤,根據“硬盤更換指導”更換風險盤。

注意

更換硬盤時,同一套存儲系統在同一時間僅能更換一塊保險箱硬盤。

更換保險箱盤時會出現“保險箱盤故障”的告警。

如果需要更換兩塊保險箱硬盤,更換完第一塊硬盤後請等待5分鐘,並觀察“保險箱盤故障”告警恢復時纔可更換第二塊硬盤。

硬盤運行指示燈示意圖

—-結束

2.2 更換非保險箱槽位的空閒盤

操作步驟

步驟 1:非保險箱槽位的空閒盤,如下圖所示的(0,10)槽位硬盤:

步驟 2: 選擇一塊風險盤,根據“硬盤更換指導”更換風險盤。

—-結束

2.3 更換空閒熱備盤

操作步驟

步驟 1:非保險箱槽位的空閒熱備盤,如下圖所示的(0,9)槽位硬盤:

步驟 2:選擇一塊風險盤,根據“硬盤更換指導”更換風險盤。

步驟 3:請參見設備熱備盤”將新更換的硬盤設置爲熱備盤。

—-結束

2.4 更換RAID組中非保險箱槽位的成員盤

操作步驟

步驟 1:若有空閒盤但無空閒熱備盤,請按照“設置熱備盤”方法選擇一塊空閒盤設置成熱備盤;若無空閒盤,在空槽位插入硬盤並設置爲熱備盤。熱備盤大小需和RAID成員盤大小一致。

步驟 2:登錄CLI執行命令(以(0,5)號盤爲需更換的硬盤,(0,16)號爲空閒熱備盤爲例),執行替換RAID組中硬盤的命令startdiskswap,例如:將硬盤(0,5)預拷貝到(0,16),則執行命令:startdiskswap -se 0 -ss 5 -te 0 -ts 16

startdiskswap

如命令執行提示硬盤類型非法,請檢查目標盤類型是否設置爲熱備盤,若目標盤類型爲熱備盤,命令執行失敗,請聯繫整改接口人。

步驟 3:使用showdisk -logic命令,查看預拷貝的情況,若拷貝完成,則目標盤(0,16)的狀態爲Normal,而需更換的硬盤(0,5)狀態爲free。如圖所示,預拷貝過程中,源盤的Logic Status爲Precopying:

步驟 4:根據“硬盤更換指導”更換風險硬盤(0,5)。並參考“設置熱備盤”,將更換上的硬盤(0,5)設置爲熱備盤。

步驟 5:執行startdiskswap -se 0 -ss 16 -te 0 -ts 5,將硬盤(0,16)數據預拷貝回新替換的(0,5)硬盤上。

步驟 6:參考查看硬盤預拷貝情況。目標盤(0,5)的狀態爲Normal,(0,16)狀態爲free則表示拷貝完成,(0,5)硬盤更換成功。參考“設置熱備盤”,將(0,16)設置爲熱備盤。

切記在執行startdiskswap時硬盤的框號和槽位號一定不能弄錯;保險箱槽位硬盤不能使用該命令進行操作。一塊硬盤更換完後再更換另外一塊,在一塊硬盤迴拷未完成時,切勿對其他硬盤進行操作。

—-結束

2.5 更換作爲RAID組成員盤的保險箱盤

操作步驟

若有空閒盤但無熱備盤,按照“設置熱備盤”方法設置熱備盤;若無空閒盤,在空槽位插入硬盤並設置爲熱備盤。(說明:熱備盤大小和RAID成員盤大小一致)

步驟 1:選擇一塊風險盤,根據“硬盤更換指導”更換風險盤。

步驟 2:更換完一塊硬盤後,系統會自動啓動硬盤的重構過程,重構完成後系統會自動將數據回拷回新更換的,請參考“查看硬盤重構和回拷狀態”查看硬盤的重構和回拷的狀態。待新更換的硬盤logic Status變爲Normal,表示硬盤已回拷完成,硬盤更換成功。

更換硬盤爲一塊完後再更換另外一塊,在一塊硬盤迴拷未完成時,切勿對其他硬盤進行操作。

—-結束

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章