2008年初,當IBM以3.5億美元收購了名不見經傳的以色列XIV公司時,並未惹起太多的喧囂。
但後來,但人們瞭解到,XIV的董事長不是別人,正是傳說中被很多人稱爲EMC旗艦存儲陣列Symmetrix之父的Moshe Yanai後,一場關於XIV產品的爭論也隨之展開。
XIV曾一直被認爲是IBM進入Web 2.0和數字媒體領域等新興市場的一塊基石,但當時IBM並沒有透露針對XIV的具體計劃。
兩週前,IBM在中國終於對外發布了XIV系統,這也終於讓我們有機會揭開了XIV產品的神祕面紗。
網格化的XIV是什麼?
對XIV而言,其跟傳統存儲系統最大的區別在於採用了粒度非常細的網格結構,數據通過這種粒度很細的網格結構,在系統裏採用大規模並行計算。
在XIV存儲系統裏面,沒有任何集中的模塊,它是由一個一個粒度很細的網格組成的,每個網格都叫數據模塊,整個存儲系統內部是由很多這樣的網格堆積而成,再用高速互聯的方式、交換的方式聯繫在一起。
通過這種方式,在底層的用戶數據分佈上採用的是粒度很細的數據分佈的方式。而將來用戶整個前端的應用服務器的數據其進來之後,通過大規模並行的方式,把所
有的數據通過均衡的方式會分散到後端所有的網格結構之上,同時也會分散到所有的物理驅動器之上,所以通過這種粒度很細的數據分佈,再通過大規模並行處理的
方式,讓後端所有的網格單元,所有的磁盤驅動器併發響應前端應用的需求,實現存儲產品的性能、可靠性方面的改進。
IBM系統與科技事業部中國區XIV技術專家王曉冬表示,相對於傳統的架構,在XIV系統中,沒有集中化的內存,也沒有集中化的大型控制器,取而代之的是
一個一個小的模塊組成的,它是把原來在用戶傳統的集中式存儲架構中鬆耦合的內存、CPU和磁盤緊耦合在一塊,做成一個一個小的網格單元,通過網格單元高速
互聯、堆疊,形成羣集計算或者羣集存儲相應能力。而每一個網格單元都可以看成是緊耦合的CPU處理能力、緩存能力加上磁盤存儲能力的結合。這裏面任何一個
網格都是完全對等的結構,通過細粒度的數據分佈,通過大規模的並行實現系統的高速的吞吐。
傳統存儲數據存儲模式
網格存儲數據存儲模式
XIV帶來了什麼?
擴展性
這種結構網格帶來的好處顯而易見,最大的好處在於擴展性,它對整個系統未來的擴展帶來了非常大的靈活性。對用戶而言,只增加新的網格單元就可以,因爲網格
單元之間是通過全交換的方式互聯在一塊,在增加到一定程度以後,一個機架不夠,使用第二個機架,甚至使用第三個、第四個。
而任何一個網格單元來講,由於採用的是業界標準的組件,實際上就是Intel+Linux,因此任何新出來的CPU技術、磁盤的技術或者是內存的技術很容
易地通過網格單元的方式,增加到系統架構裏面去,將來整個系統更新換代也好、擴展升級也好,可以把業界最新的技術很容易地應用到這個環境之下。不需要像傳
統存儲一樣,要設計新的控制器,設計新的內部的背板,等等這樣一些複雜的,產品週期需要24個月或者更長的時間。
“IBM把這種擴展結構叫做Scale
Out,意思是向外擴展”,IBM系統與科技事業部中國區XIV技術專家王曉冬表示,“傳統的存儲結構,叫‘Scale
UP’的概念,原來的高端系統性能不夠的話,我們會把它的控制器重新設計,用更快的CPU,用內部設計更新的背板的結構,通過更快的控制器,通過更大的緩
存做性能和容量的提高。在這裏面,我們作爲任何一個Data
module處理能力很有限,但是在擴展的時候,通過大規模網格單元併發擴展的方式實現整個性能的提高。所以這也是它的設計理念上,我們叫向外擴展的概
念。”
IBM系統與科技事業部大中華區產品部總經理侯淼
IBM系統與科技事業部中國區XIV技術專家王曉冬
穩定性
作爲XIV來講是全虛擬化的系統,最核心的思想就是用戶將來所有的數據是通過XIV智能的算法,自動地均衡到後端所有的磁盤上。核心的設計理念是平衡或者
叫做恆定均衡的概念。任何一個前端併發的I/O過來,會同時用到的後端所有的網格單元的計算中,用到後端所有的磁盤來併發地來存儲,這樣後端達到平衡的狀
態,這種平衡的狀態即使系統發生變更的時候仍然可以得到保持,比如增加新的網格單元,或者把一些舊的網格單元因爲生命週期結束需要從環境中拿下等等,任何
系統發生變更的時候,後端所有的網格單元會參與這個數據的重建,所有的磁盤單元也會參與這個數據的重建。
王曉冬談到,“實際上,XIV是通過很多小的模塊併發運作的方式實現整個系統的可靠性和穩定性。目前在用戶的存儲環境裏,有些控制器很忙,有些控制器很
閒,而有些磁盤可能很忙,有些磁盤不忙,這些都是存儲系統中的熱點問題,而這些熱點的存在對用戶的IT環境有隱患,而通過這種平衡的方式,可以實現所有的
部件、磁盤、所有的網格單元不出現熱點的問題,達到整個系統的可靠性和性能的優越性。”
簡單性
按照IBM的測試,由於在整個系統裏面採用大規模併發及恆定的均衡實現自恢復和自優化,在系統裏採用1TB的SATA磁盤驅動器出現故障的時候,整個系統
恢復1TB數據只需要將近30分鐘的時間,這30分鐘的時間是指整個數據系統完全充滿的情況下,如果用戶數據沒有充滿的話,整個1TB單盤驅動器出現故障
恢復的時間只需要15分鐘甚至更短。即使跟今天高端的FC存儲系統去比的話,可以看到整個的恢復時間大概相當於目前主流的光纖驅動器的1/10甚至更短,
這方面整個的大規模併發的結構對於整個系統的可靠性提供了一個全新的概念。
對於XIV產品的特點,IBM系統與科技事業部大中華區產品部總經理侯淼自然是相當得意,“XIV的管理很簡單,以至於我們沒有什麼多說的地方。因爲它整
個的系統將來設計完之後,用戶看到的就是80TB的存儲池。然後用戶做的工作很簡單,基本上就是兩步的動作,設計“Volume”,讓主機看到
Volume,只需要選一個名字再加上你的大小就可以了。所以管理在虛擬化的管理環境之下真的非常簡單,非常方便。用戶不需要再像傳統的存儲一樣,是做
RAID5還是RAID1,再做相應的一系列設置。整個安裝的時間、調整的時間都是上週甚至更長的時間,這個系統安裝可能就兩個小時完畢,用戶使用半個小
時供給一下卷,下午就可以on
production。這是高端存儲和企業存儲裏面在SAN環境下革命性的理念,就是它的管理真的非常簡單、非常的方便。”
更省錢的解決方案
由於XIV後端採用恆定均衡的方式,整個系統實現了自動性能優化,也就是在這個系統裏面,用戶不需要買任何所謂的存儲優化軟件,不需要任何的後端磁盤均衡的軟件,系統已經自動通過算法的方式幫你實現了,也就是整個系統是一個非常恆定均衡的方式。
更綠色的產品
能耗問題——在現在看來,對商用產品而言,這個似乎是個不能不談的話題,在這裏,按照IBM的解釋,XIV表現得同樣很優秀。
侯淼表示,“作爲存儲產品的能耗,或者空間、機房的佔用,已經越來越成爲大家關心的因素”,“當突然到了TB級規模的時候,大家開始意識到存儲
產品也是個高能耗、高排放的產品,這種情況下,XIV是綠色IT非常好的體現,最重要的原因是,XIV內部採用的是最節能的SATA的磁盤驅動器,通過大
規模併發的方式,雖然我的單磁盤驅動器的性能沒有FC驅動器快,但通過併發的方式,可以實現整個系統性能的提升同時在能耗和佔地方面有很大的節省,相對於
傳統高端的FC驅動器來講,能耗或佔地可能只相當於幾分之一的概念,所有很多用戶對於基礎設施因素非常關注的時候,實際上給他們提供很好的選擇了。”
從Scale up到Scale Out
用做PC的架構,或者說用x86架構來做存儲一直都是一個選擇,對於廠商來說,這樣的架構容易獲得,研發成本極低而產出則非
常不錯,當然,基於x86架構的產品的價格也更能夠讓用戶接受,但是,與更專業的專用控制器的架構相比,更高的出錯率與更少的模塊化設計很難令這些產品走
進高端市場,很多廠商曾經嘗試過在x86架構上把存儲做的更高,但是好象沒有人成功,原因就在於:我們可以把性能做的更好,但是架構上的劣勢讓MIPS仍
然是英特爾難以企及的控制器處理器競爭對手——無數的用戶都不那麼相信英特爾能夠比MIPS做得更好,而且,事實或許也是如此。
因此,當業界出現像XIV這樣產品時,恰好給了PC架構一個機遇,那就是去迎合集羣,用集羣的方法保證其性能和容錯性能,用侯淼的話說就是:“從
Scale up 到Scale Out。”—他談到,“我們有兩種可以擴展存儲系統的方法,一種是Scale out,一種是Scale
up。Scale
up的出發點是,我怎麼樣通過提升CPU、內存的性能來提高我的整個系統的速度。這種方式實際上帶來的好處是,當CPU赫茲從1giga到4giga確實
能夠提高整個的處理速度,但是磁盤和緩存包括和CPU之間有非常大的處理的速度的差別,這個差別在過去幾年,並沒有減少,反而在增大,所以Scale
up的好處在於當你有一些類型應用的時候,像在線處理的時候,可能Scale up是一個使用方式,但是針對比較密集型的大型數據塊來講,Scale
Out反而是比較好的處理方法。”
王曉冬認爲,XIV的出現能夠彌補DS8000的一些“力所不能及”的事情,他表示,“在一些特殊的情況下,比如一些新的應用,或者Web2.0的應用,
它的容量的增長,性能要求會有非常高速、快速的增長,用傳統的Scale up方式的話,很難匹配相應的增長速度,所以這種情況下Scale
out更能適合這種類型應用的發展,基本上是面向兩種不同類型的應用,兩種不同類型的技術出來。”
侯淼認爲,IBM的XIV的核心競爭力在於算法,“Scale out技術的含金量在於算法,非常依賴於算法和軟件,所以大家可以看到其實像XIV它的硬件平臺並不奇怪,就是幾個完全的標準組件建在一起,但其算法是通過算法把整個負載平衡,這不是所有廠家都有的。”
集羣的好處在於:越多的擴展造就更高的性能,當然,安全性也就越高,不過,必須要關注的是,XIV的可擴展性,無論是性能還是容量抑或是容錯性,其代價都
是源於對容量的損失——XIV內部有180塊1TB的磁盤,數據做的是鏡像的保護,是80TB的可用容量,當然,這就是XIV,以集羣的方式將數據複製兩
份,並分佈存儲,對於這樣的概念,或許不用多講了。
XIV真能重新定義存儲系統?
實際上,XIV系統唯一的弱點在於其性能的實現需要大量的冗餘設備,而過多的冗餘有時候對用戶而言的確是一種浪費,不僅是磁盤,連交換機也需要冗餘,這也
註定了XIV這個產品的本身,定位在了高端用戶的應用。這一點,侯淼也坦然,XIV適用於那些未來2-3年數據增長很快的應用,這時候XIV就是一個很好
的產品。而對目前衆多的中小企業來說,由於該產品的價格昂貴,因此只要採用服務器+存儲的NAS結構就可以了。
在侯淼看來,建議用戶採用XIV設備的原因有三:
1、數據增長速度相當快;2、物理的擴展已經到達了上限,現有中端或者高端的存儲設備已經無法再進行擴展,而且需要數據移植;3、混合的數據負
載,由於數據類型的多樣化,造成存儲產品所提供的數據服務無法保持一致的性能,以保證它所服務的對象提供一個高質量的數據響應服務。
在這三種情況下,XIV就是一個非常好的選擇。
“用戶在混合的負載情況下,同時在數據量成長非常快的情況下,怎麼能保持一致的性能,這點也是我們去推薦一個XIV產品的關鍵的考覈點,它數據量很大的時
候,它的應用有很多,怎麼保證它所服務的對象提供一個高質量的數據響應服務,這點XIV就是一個非常好的選擇。”
能否挑戰EMC的分級存儲?
衆所周知,在IBM單個存儲系統的內部,是不存在分級存儲的概念的,而這與EMC的產品有很大的差別,EMC存儲系統內部,有SATA盤、FC盤、SSD
盤等等能夠混插,不同的盤陣則提供不同的存儲應用,這也是EMC所提出的分級存儲概念,而對XIV而言,由於設計的理念就是講究的均衡,因此,在XIV系
統裏是不分成TIER1和TIER2的,XIV更加趨向於混合的負載。
侯淼認爲,“實際上XIV設計的出發點已經很明確了,它認爲所有的負載應該是一致的,而且是混合的,所以在XIV這個系統裏面,是不分成TIER1和
TIER2的,沒有這個概念,當你兩個存儲器的定位,像8000,就對那些客戶對自己的應用很瞭解,知道哪些是TIER1和TIER2,能夠管理數據未來
成長的趨勢。”
實際上,在收購XIV之前,IBM缺少存儲市場兩個重要的組成部分:低價的PC架構存儲系統和可以從小變大的集羣存儲系統,雖然IBM一直擁有從
DS3000到DS8000等一整套系列的存儲系統,但IBM的用戶們仍然面臨着一個選擇:是選擇其它供應商的更便宜的PC架構存儲,還是去繼續選擇
IBM的控制器架構的存儲系統——這不僅僅是錢的問題,而關係到擴展性、靈活性以及整個企業存儲架構的未來選擇。
通過XIV,IBM爲用戶的兩種選擇都提供了答案,或者說,IBM提供了一種可能性:如果你需要可擴展性強而又價格低廉的存儲系統,你可以選擇XIV,而
無需花費昂貴的錢去購買DS系列的產品,當然,獲得高擴展性和低價格的XIV也是需要付出一定的代價的——這需要另當別論,因爲這個話題的答案從來都只有
平衡和捨棄,而不是十全十美。
採訪後記:關於新數據中心的結構發展,最近一年來一直衆說
紛紜。儘管名稱五花八門,例如按需計算、實用工具計算、網格計算等等,但它們都指向同一個理想:一個動態響應用戶需求的虛擬數據中心資源池。這個理想是如
何形成的並不是祕密,任何IT經理都知道,在傳統數據中心內形成的標準操作程序是一件多麼枯燥的動手工作。而存儲領域對於簡單和自動化的迫切需要無疑是最
爲明顯的。在IBM的XIV上所體現出的網格存儲技術,也許並不能代表着下一代數據存儲技術的發展方向,但至少我們可以看到,存儲設備邁向整合和虛擬化的
趨勢已經起步,而它是由對效率和響應能力的實際業務要求所推動的。