造成RAID組癱瘓的情況有很多,掌握這幾步即可高效解決問題

  • 服務器設備類型

   HP DL380服務器

300G SAS盤 數量三塊

  • 服務器故障描述:

硬盤磁盤故障導致整個RAID組癱瘓,具體顯示爲其中一塊硬盤狀態燈爲紅色。由於數據庫存儲在D分區,備份存儲在E分區。存儲故障,造成D分區不可識別,E分區可識別,但是拷貝備份文件報錯,通過重啓服務器,導致先離線的硬盤上線,並同步了一段時間,在沒有同步完成就直接強制關機,之後未對服務器做任何操作。

  • 服務器數據恢復操作流程
  1. 爲了確保現存磁盤中數據的安全,先對磁盤做只讀鏡像備份,三塊硬盤可以正常讀取,沒有發現壞道。只讀鏡像備份日誌如下圖所示

     

  2. 對備份的鏡像文件進行詳細分析,重組raid結構,並進行異或校驗,部分校驗通過。由於離線硬盤上線之後進行同步操作,會損壞數據,所以如下圖所示表示數據有損壞的情況。

 

3、對備份的鏡像文件進行詳細分析,重組raid結構,並進行異或校驗,部分校驗通過。由於離線硬盤上線之後進行同步操作,會損壞數據,所以如下圖所示表示數據有損壞的情況。

 

 

4、首先針對E分區中的dat文件進行分析修復。發現兩個備份文件都有損壞,如下圖:

 

5、分析聚合dat碎片,驗證dat數據完整性,底層結構顯示有損壞。

 

6、同時進行D分區的數據文件的分析掃描,由於存儲同步,數據文件目錄不可見。

7、對D分區自由空間數據頁掃描,並對文件碎片進行分析和聚合。

8、驗證數據文件碎片的完整性和有效性。

9、提取備份文件中的數據記錄到新建的數據庫中。

10、通過上層應用連接數據庫,驗證數據可用性,數據庫文件可以正常加載,上層應用軟件中用戶賬號正常,可以進行正常數據查詢。

 服務器數據恢復結果

對重組的raid結構進行異或檢測,發現數據部分被同步損壞,但是還有部分數據正常

在恢復過程中,在E盤發現2個SealLib數據庫的備份文件。但是備份文件數據中頁結構有小部分損壞, 

在D分區掃描的結果中數據碎片發現較連續的數據片段,碎片可用。通過對D分區碎片和E分區備份文件進行整合拼接。

五、服務器數據恢復結論:

通過工程師解析處理,最終修復解析出的數據可以支撐整個應用的正常使用,上層應用可以正常查詢數據庫內容,至此數據恢復工作結束。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章