淺析RAID0/1安全差別及處理數據安全的應對方式

RAID0/1分析背景

基於之前接到用戶的委託,萌生想要嘗試分析下RIAD0/1的安全差別,希望給更多需要的朋友帶來幫助。用戶的設備信息如下:

1、SCSI RAID0+1由4塊36G SCSI組成

2、經與用戶溝通,用戶表明是做了兩組RAID1。出故障後,RAID狀態裏3塊盤OFFLINE。

RAID0/1數據分析步驟

硬盤單獨接在SCSI適配器上,進入系統,硬盤無異常,可以正常識別分析,無明顯RAID信息區域,之後對4塊盤做比較,結論是1、3號盤及2、4號盤每組都有相同性,但後面有大量不一致數據。1號盤及2號盤裏有分區表,每個分區表裏的描述都大約指出原邏輯盤分區總和大約68G。

據此,可判斷有以下三種情況:

1、兩組RAID0,但1、3號及2、4號均有部分完全相同的數據,應該可以排除。

2、RAID1+0(即兩兩做RAID1,再做RAID0,這種安全級別高),經後續對硬盤的監控發現,兩組RAID1中先後都有一塊硬盤離線(此後就相當於RAID0,再不能提供任何冗餘)。再後來,又有一塊硬盤離線,系統崩潰。這種情況非常符合RAID裏的表現。

3、RAID0+1(即兩兩做RAID0,再做RAID1,這種不太好,推斷可能性不大)

根據分析後,發現除1、3組成的RAID,無任何錯誤。重組數據。直接寫回RAID,系統正常可以啓動。文件訪問也正常。但是,數據經用戶查看發現是幾年前的數據,並不是當前需要的那部分。

RAID0/1數據分析結論

經再次與用戶詳細溝通了解到:用戶早期做了RAID0+1,結果組成RAID1中的其中一組RAID0中有一塊盤離線(應該爲1或3),導致整個RAID0離線(兩塊離線了),之後一直以單RAID0的方式工作,直到最近,剩下的一組RAID0中有一塊盤離線,RAID徹底癱瘓。用戶使用的RAID卡爲ADAPTEC的0通道RAID卡,無法安全緩衝數據,最後離線時,因數據部分未寫入等原因導致文件系統一致性有問題。最終重新組織3及5號盤,修正錯誤,經用戶再次驗收查看後數據無誤,至此數據恢復工作結束。

RAID0/1安全差別分析

通過上述案例表明RAID0+1及RAID1+0的安全差別,那麼下面爲大家細說下這部分。

1、 RAID0+1:

結構爲,兩塊以上(含兩塊)硬盤先做條帶(RAID0),組成相同的兩組一級邏輯盤。再將兩組邏輯盤做鏡像(RAID1)。如下圖:

RAID0+1的冗餘性(安全性):只要有一塊盤出錯,它所在的RAID0就會整體離線,只能靠最外層的RAID1的冗餘來支撐。實際上,只能允許一塊盤出錯,這樣如果在4塊以上的硬盤盤陣中,安全性實際會差得多。

利用率:1/2

效率:讀與寫均可以實現N/2(N爲硬盤總數)的理論帶寬

實現:容易,控制器無需強勁處理能力,通常也無需大緩衝。

2、RAID1+0:

結構爲,兩塊以上硬盤先做鏡像(RAID1),組成相同的兩組或兩組以上一級邏輯盤。再將兩組(或兩組以上)邏輯盤做條帶(RAID0)。如下圖:

 

RAID1+0的冗餘性(安全性):只要有一塊盤出錯,它所在的RAID1中不會有問題,所以每組RAID1中都允許有一塊盤離線。安全性:損壞兩塊盤崩潰的機會只有2/(N-1)。

利用率:1/2

效率:讀與寫均可以實現N/2(N爲硬盤總數)的理論帶寬

實現:容易,控制器無需強勁處理能力,通常也無需大緩衝。

RAID0/1安全差別分析結論

上述分析,可以明顯看到,RAID1+0比RAID0+1的安全級別會高很多,其他參數卻相同。所以,需要安全級別高的場合下,一定要選擇RAID1+0。實際上,RAID0+1是華而不實的結構,很少會有它的適用場合。本文提及的案例,如果用戶使用的是RAID1+0,出故障的概率便會低得多了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章