以下內容爲公司的設備維保廠商提供給我的,原因是硬盤有故障,但未發生重構,所以需要手動操作讓熱備盤頂替故障盤。
我在OceanStor S3900上進行了操作(開啓ssh,進入命令行終端進行操作),很順利。本文有所更改,部分圖片重新進行了截取。
風險硬盤更換操作指導
執行命令showupgradepkginfo -t 1查看版本信息,根據設備版本(Package Version),確認風險硬盤的更換方法。
showupgradepkginfo
版本 | 實施方法 |
V100R002C00SPCh00 V100R002C01SPCh00 V100R005C00SPC700及之後的版本 V100R005C01SPC700及之後的版本 V100R005C02所有版本 |
按方法一實施風險硬盤更換 |
V100R001所有版本 V100R002C00SPCh00之前所有版本 V100R002C01SPCh00之前所有版本 V100R005C00SPC700之前的版本 V100R005C01SPC700之前的版本 |
按方法二實施風險硬盤更換 |
說明:V100R002版本依次爲V100R002C00SPC001, SPC002…V100R002C00SPC015, SPCg00, SPCh00
V100R005版本依次爲V100R005C00SPC002, SPC003,SPC400…SPC600, SPC700,SPC800,SPC900
方法一
操作步驟
步驟 1:登錄命令行,輸入developer,按照提示輸入密碼debug@storage。
步驟 2:執行命令showdisk -logic命令,確認需要更換的風險盤框號和槽位號。Disk Location爲硬盤的框號和槽位號。
showdisk
步驟 3:執行命令simudiskimpendfail -e enclosureid -s slotid。其中enclosureid爲硬盤的框號,slotid爲硬盤的槽位號。以Disk Location爲(1,0)爲示例,則執行命令simudiskimpendfail -e 1 -s 0,執行該命令後,系統會產生該硬盤即將失效的告警。
步驟 4:執行後,硬盤會自動進行預拷貝,將數據拷貝到熱備盤。通過命令showdisk -e enclosureid -s slotid查詢Precopying的進度,等待硬盤的狀態變爲Reconstruced狀態,即可正常進行故障盤更換。
步驟 5: 硬盤更換後,再查看硬盤的重構和回拷的狀態。
注意:
更換硬盤時,同一套存儲系統在同一時間僅能更換一塊保險箱硬盤。
更換保險箱盤時會出現“保險箱盤故障”的告警。
方法二
根據硬盤的槽位信息和邏輯類型和邏輯狀態進行更換,詳細更換方法,請參考如下表格進行選擇。
槽位 | showdisk -logic查詢結果 | 更換方法 |
保險箱槽位 | Logic Type爲Free的硬盤 | 參考2.1進行更換 |
非保險箱槽位 | Logic Type爲Free的硬盤 | 參考2.2進行更換 |
非保險箱槽位 | Logic Status爲Free spare的盤 | 參考2.3進行更換 |
非保險箱槽位 | Logic Type爲Member盤 | 參考2.4進行更換 |
保險箱槽位 | Logic Type爲Member盤 | 參考2.5進行更換 |
說明:針對Logic Status爲Used spare的硬盤,需要等待重構到該槽位的硬盤更換後,硬盤會自動釋放爲Logic Status爲Free spare或者Logic Type爲Free的硬盤。
2.1 更換非RAID組成員盤的保險箱盤
操作步驟
步驟 1:確認風險硬盤爲保險箱盤(即系統盤,如下圖紅色框標識,位於控制框的前四個槽位)。
以2U24盤位控制框保險箱盤的位置爲例:
2U24盤位控制框保險箱盤位置示意圖
以4U24盤位控制框保險箱盤的位置爲例:
4U24盤位控制框保險箱盤位置示意圖
如圖所示,槽位號爲0,1,2,3且邏輯狀態爲Free的保險箱盤:
保險箱盤
步驟 2:選擇一塊風險盤,根據“硬盤更換指導”更換風險盤。
注意
更換硬盤時,同一套存儲系統在同一時間僅能更換一塊保險箱硬盤。
更換保險箱盤時會出現“保險箱盤故障”的告警。
如果需要更換兩塊保險箱硬盤,更換完第一塊硬盤後請等待5分鐘,並觀察“保險箱盤故障”告警恢復時纔可更換第二塊硬盤。
硬盤運行指示燈示意圖
—-結束
2.2 更換非保險箱槽位的空閒盤
操作步驟
步驟 1:非保險箱槽位的空閒盤,如下圖所示的(0,10)槽位硬盤:
步驟 2: 選擇一塊風險盤,根據“硬盤更換指導”更換風險盤。
—-結束
2.3 更換空閒熱備盤
操作步驟
步驟 1:非保險箱槽位的空閒熱備盤,如下圖所示的(0,9)槽位硬盤:
步驟 2:選擇一塊風險盤,根據“硬盤更換指導”更換風險盤。
步驟 3:請參見設備熱備盤”將新更換的硬盤設置爲熱備盤。
—-結束
2.4 更換RAID組中非保險箱槽位的成員盤
操作步驟
步驟 1:若有空閒盤但無空閒熱備盤,請按照“設置熱備盤”方法選擇一塊空閒盤設置成熱備盤;若無空閒盤,在空槽位插入硬盤並設置爲熱備盤。熱備盤大小需和RAID成員盤大小一致。
步驟 2:登錄CLI執行命令(以(0,5)號盤爲需更換的硬盤,(0,16)號爲空閒熱備盤爲例),執行替換RAID組中硬盤的命令startdiskswap,例如:將硬盤(0,5)預拷貝到(0,16),則執行命令:startdiskswap -se 0 -ss 5 -te 0 -ts 16
startdiskswap
如命令執行提示硬盤類型非法,請檢查目標盤類型是否設置爲熱備盤,若目標盤類型爲熱備盤,命令執行失敗,請聯繫整改接口人。
步驟 3:使用showdisk -logic命令,查看預拷貝的情況,若拷貝完成,則目標盤(0,16)的狀態爲Normal,而需更換的硬盤(0,5)狀態爲free。如圖所示,預拷貝過程中,源盤的Logic Status爲Precopying:
步驟 4:根據“硬盤更換指導”更換風險硬盤(0,5)。並參考“設置熱備盤”,將更換上的硬盤(0,5)設置爲熱備盤。
步驟 5:執行startdiskswap -se 0 -ss 16 -te 0 -ts 5,將硬盤(0,16)數據預拷貝回新替換的(0,5)硬盤上。
步驟 6:參考查看硬盤預拷貝情況。目標盤(0,5)的狀態爲Normal,(0,16)狀態爲free則表示拷貝完成,(0,5)硬盤更換成功。參考“設置熱備盤”,將(0,16)設置爲熱備盤。
切記在執行startdiskswap時硬盤的框號和槽位號一定不能弄錯;保險箱槽位硬盤不能使用該命令進行操作。一塊硬盤更換完後再更換另外一塊,在一塊硬盤迴拷未完成時,切勿對其他硬盤進行操作。
—-結束
2.5 更換作爲RAID組成員盤的保險箱盤
操作步驟
若有空閒盤但無熱備盤,按照“設置熱備盤”方法設置熱備盤;若無空閒盤,在空槽位插入硬盤並設置爲熱備盤。(說明:熱備盤大小和RAID成員盤大小一致)
步驟 1:選擇一塊風險盤,根據“硬盤更換指導”更換風險盤。
步驟 2:更換完一塊硬盤後,系統會自動啓動硬盤的重構過程,重構完成後系統會自動將數據回拷回新更換的,請參考“查看硬盤重構和回拷狀態”查看硬盤的重構和回拷的狀態。待新更換的硬盤logic Status變爲Normal,表示硬盤已回拷完成,硬盤更換成功。
更換硬盤爲一塊完後再更換另外一塊,在一塊硬盤迴拷未完成時,切勿對其他硬盤進行操作。
—-結束