服務器數據恢復案例之RAID信息丟失數據恢復

【數據恢復故障描述】

今天爲大家介紹的是服務器數據恢復案例,服務器的故障是raid信息丟失了。下面簡單介紹一下本次數據恢復的服務器基礎信息:某品牌DL380系列服務器,存儲是由6塊73GB SAS硬盤組成的RAID5磁盤陣列,服務器上層操作系統是WINDOWS 2003 SERVER,服務器內主要存儲了企業的內部文件,沒有數據庫文件,在服務器的主機(無UPS)發生故障前曾經出現過幾次意外斷電的情況,由於重啓後並沒有出現異常,因此服務器一直在使用,直到有一次斷電重啓後RAID報錯,提示無法找到存儲設備,進入RAID管理模塊後操作死機,管理員多次嘗試重啓服務器後還是沒有辦法進入系統,爲了防止服務器內數據丟失,管理員聯繫到北京北亞數據恢復中心進行服務器數據恢復。

【數據恢復故障分析】

通常服務器出現這種情況的數據丟失多因爲服務器意外斷電導致RAID模塊損壞(包括RAID管理信息丟失和RAID模塊硬件損壞)。一般在RAID陣列創建完成後陣列的管理模塊信息就固定下來不會再發生改變,但是raid陣列的模塊信息依然屬於可修改部分,服務器意外斷電很容易造成這部分信息被篡改甚至丟失,多次斷電甚至有可能導致RAID卡上的元器件損壞,從而使主機失去對多塊物理硬盤進行RAID管理的中間層模塊。該案例中對RAID模塊的操作死機現象極有可能是由RAID卡硬件損壞引起的(後經HP售後技術人員驗證得到證實),此時通過正常途徑已無法將獲取6塊硬盤中的數據,只能依靠第三方提供數據恢復服務來解決。

【服務器數據恢復過程】

1.服務器數據恢復第一步首先對客戶的服務器內所有硬盤進行嚴格的物理檢測,用以排查硬盤是否有硬件故障。經過檢查發現服務器內的所有硬盤均可以正常讀取。

2.由於硬盤全部正常,因此不需要進行硬件修復,直接對服務器內的硬盤進行鏡像備份即可。

3.鏡像完成後,服務器數據恢復工程師開始對這組raid進行結構分析,主要是爲了確定raid陣列的硬盤順序、數據塊的大小和陣列校驗方式等用於重新構建raid陣列。

4.服務器數據恢復工程師利用分析出來的raid陣列信息重新虛擬重建一組raid陣列並進行邏輯校驗,確保重構RAID所應用的各參數正確無誤後,針對用戶最爲關注的數據進行完全驗證;

5.最後,數據恢復工程師聯繫客戶對恢復出來的數據進行驗證,經過驗證後所有數據均已經成功恢復,數據遷移成功後本次數據恢復圓滿結束。

【服務器存儲安全建議】

1.儘量保證機房電源供應穩定,以減少電源異常對主機及存儲的衝擊;

2.最好爲重要的服務器及存儲配置UPS,可在機房意外斷電的情況下保證核心業務系統能繼續維持一定時間的正常工作,從而爲企業尋求應急解決方案贏得寶貴的時間;

3.對於服務年限已久的服務器應定期進行安全狀況檢查,並對其整體運行狀態進行評估以決定是否進行硬件及系統的全面升級,同時提前制定突發數據災難的緊急處理方案,以降低數據災難帶來的業務損失。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章