服務器raid5陣列故障排查及數據恢復過程記錄

【服務器故障情況概述】

今天介紹的是服務器raid5陣列因爲不明原因導致陣列崩潰後的故障排查方法,以及服務器數據恢復過程。下面簡單介紹一下需要恢復數據的服務器硬件配置情況:
本次數據恢復案例中的服務器型號爲某品牌X3850型號,服務器上組建了一個raid5磁盤陣列,陣列裏包含4塊成員盤和1塊熱備盤一共5塊。
服務器再正常使用過成功突然崩潰,管理員查看raid陣列狀態時發現陣列中有2塊硬盤掉線,熱備盤沒有啓用。需要從服務器層面進行數據恢復操作。
·
【服務器數據恢復普通流程】
首先關閉服務器並保證在排查故障和數據恢復的過程中原始服務器狀態不被破壞或變更。
將陣列內所有硬盤明確編碼後移除服務器,將硬盤掛載到服務器數據恢復專用存儲設備上,對raid5陣列中的所有硬盤做完全鏡像後恢復故障服務器狀態。
對鏡像出的服務器數據進行raid結構分析,通過分析提取到磁盤陣列的raid條帶信息、條帶分佈規律、raid陣列校驗方向以及meta區域等基礎信息。
得到上述陣列信息後,服務器數據恢復工程師在數據恢復專用服務器上虛擬重組了一個相同的raid5陣列環境,進一步解析虛擬磁盤的文件系統數據。
對分析出來的數據進行驗證提取,確認數據正確後使用linux livecd或win pe(通常不支持)等進行數據回遷。
服務器raid5陣列故障排查及數據恢復過程記錄
·
【服務器raid5數據恢復過程】
數據恢復工程師對所有硬盤進行鏡像後分析raid5結構,經過分析得到最佳結構爲0,1,2,3盤序,缺3號盤,塊大小512扇區,backward parity(Adaptec),
按照服務器數據恢復普通方法,數據恢復工程師對上述數據進行驗證,所有壓縮包均可正常解壓,結構正確。
按照數據恢復工程師分析到的raid5陣列結構虛擬重組raid陣列,重組後的raid5陣列經過驗證未發現任何報錯。
對raid5陣列的文件系統進行解析和數據提取,提取數據正常。
經客戶服務器管理員對提取出來的數據驗證後配合客戶管理員將恢復出來的所有數據回遷到客戶準備的服務器內。回寫後啓動操作系統進行最終數據驗證。
·
【服務器數據恢復結果】
經過客戶服務器管理員驗證,服務器raid5陣列內的所有數據恢復完整,數據應用正常,本次數據恢復圓滿完成。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章