EMC CX4-480數據恢復案例

EMC CX4-480數據恢復案例

    EMC做爲存儲界的領軍品牌,其存儲產品可謂是人盡皆知啊!並且EMC自己的存儲系統以及它自己的硬件在存儲領域中都是領先的。但這還是不能百分之百保證用戶數據的絕對安全,因爲用戶的誤操作以及硬件的老化都會導致用戶重要的數據丟失。而發生這些故障之後只能找專業的數據恢復公司做數據挽救工作。作者最近就處理過一起EMC CX4-480因磁盤故障導致存儲不可用的案例,見下文。

 

    一位上海的客戶描述說他們有一臺EMC CX4的存儲服務器,因爲硬盤出現故障,導致整個存儲陣列癱瘓。整個LUN是由71TB的硬盤組成的RAID 5。由於客戶是在上海,並且不方便將服務器郵寄過來,只好電話指導客戶將存儲服務器正常關機,並取出硬盤做好標記。然後將所有硬盤打包好,郵件到北京進行數據恢復。在接到客戶郵寄過來的包裹後發現,客戶寄過來的是101T的硬盤。當時很驚訝!不是說是7塊盤麼?怎麼多了3塊。在打電話仔細問過客戶後得知,其中有3塊是以前存儲中掉線的硬盤。好吧!估計是以前存儲中有硬盤掉線了,但客戶只是添加了一塊的新的硬盤做rebuild,並沒有將掉線的硬盤拔掉,所以就多出了3塊。因客戶說是存儲服務器中有些硬盤有故障才導致存儲服務器不可用的,所以初步判斷是RAID中有硬盤掉線了。將所有硬盤交給硬件工程師檢測硬盤是否有硬件故障。在檢測完成後發現並沒有物理故障,那麼可能就是硬盤上有邏輯壞道或其他原因導致RAID不可用了 。接着對所有硬盤做全盤鏡像,以保證客戶現有數據的安全。對所有盤做鏡像可是真一個很漫長的時間啊!


    做完鏡像後開始分析RAID的結構,可是當我用winhex打開鏡像盤的時候,我驚呆了!因爲EMC的硬盤每512字節多加了一個8字節的校驗,也就是變成了每扇區520字節了。這樣雖然可以分析RAID的結構,但是重組RAID就現的費勁了!爲了提高工作效率,我決定還是寫個小程序將8字節的校驗去掉吧!這樣後期的工作也方便了許多。就這樣碼代碼中......

 

     經過漫長的寫碼加調試,終於OK了。那麼開始一個磁盤一個磁盤的轉換吧!哦買噶....這又是一個很耗時的工程。慢慢等吧!

 

    等所有磁盤都轉換完成後,就開始分析RAID的結構了。由於多了3塊以前的舊盤,需要先找出這三塊舊盤。這個比較好辦,可以比較一下每塊磁盤,其中會有兩塊磁盤前面的一部分相同,而這兩塊當中會有一個是舊的,舊的數據量應該沒有新的多,就可以排除舊的磁盤了。這樣的磁盤會有3對,也就可以排除所有舊的磁盤了。接下來看RAID結構,由於客戶用的NTFS文件系統,用MFT很容易就可以找到RAID的結構了。知道RAID結構後發現這不是一個普通的RAID 5,而是一個雙循環。用winhex還沒法重組RAID。最後找了半天發現,UFS可以重組RAID。那麼就先用它重組RAID看看是什麼情況吧!重組RAID後發現數據不是最新的。我想可能是RAID 5先掉線一塊硬盤,而管理員沒有及時發現,沒有及時添加新的硬盤做rebuild。導致運行一段時間後又有一塊硬盤掉線了,才造成整個RAID不可用。所以還需要找出一塊舊的磁盤,才能生成最新的數據。那就找唄!但是怎麼找呢?只能嘗試依次踢掉一塊硬盤,然後重組RAID。看最新的數據是否可用。直到找到最新的數據可用爲止,接着就可以導出數據,驗證數據了。

         

    整個恢復過程,包括做鏡像,扇區轉換和最後的拷貝數據,一共耗時5天。數據恢復率達百分之九十九以上。雖然整個過程比較漫長,但是最終的結果用戶很高興,因爲這給他們帶來了不必要的損失。

 

作者:鄧奇 (北亞服務器數據恢復工程師)

郵箱:[email protected]

聯繫方式:010-4006505808-801

 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章