超融合架構的本質是什麼(上)

注:本文轉載自【SmartX超融合】微信官方公衆號。


整個市場近年來對超融合的關注度越來越高,但各家廠商的超融合架構實現方法各有不同。筆者不評判對錯,也不去探究這些是不是真正的超融合,而是重新追本溯源,思考爲什麼超融合現在被關注,什麼樣的 IT 架構更“合適”於當今的商業。


首先,SmartX 選擇超融合架構的原因,是傳統存儲解決不了現在企業數據中心的問題。據麥肯錫研究顯示,全球的IT數據每年在以 40% 的速度增加中。數據正在逐步影響商業,企業通過數據的分析來做決策與管理。完成快速的分析決策和管理,就需要藉助強大的數據中心。下圖爲傳統 SAN 存儲:

傳統架構.png

傳統 SAN 存儲


但是,光靠越來越快、核數越來越多的 CPU 是不夠的,瓶頸在於傳統存儲的硬盤太慢了,CPU 大部分計算能力都空閒或者說在等待存儲數據傳輸過來。傳統存儲容量和性能不具備和計算能力匹配的可擴展性,不能滿足企業進行數據訪問的需求。

傳統架構IO.jpg

傳統 SAN 存儲遭遇 I/O 瓶頸


這個問題並不是現在纔有。Google 很早遇到這個問題。那麼 Google 是如何做的呢?

作爲一個給全世界互聯網網民提供數據檢索的企業,Google 考慮過 EMC、IBM,還有當年的 SUN 存儲產品,但是都解決不了它的問題。無論是容量還是性能,這些公司的產品都無法滿足 Google 的規模需求。於是 Google 只能自己建立一個適合自己的數據搜索的存儲結構了。

Google 優秀的計算機科學家們,打破了傳統的存儲思維,利用服務器的本地硬盤和軟件構建了一個容量和性能不斷可擴展的分佈式文件系統,並在其上構建了其搜索和分析的計算引擎:

不用把數據從存儲端取出來,然後通過網絡傳輸到計算端,而是將計算直接分發到存儲上運行,將“計算”作爲傳輸單元進行傳輸,這樣大量的存儲數據都是本地訪問,不需要再跨網絡上傳輸了,自然訪問很快。於是乎,自然而然地,“計算”和“存儲”運行(“融合”)在了一個服務器上,這裏也看到超融合架構的一個優勢就是,本地訪問數據,不必跨網絡。

超融合架構.png

超融合架構示意圖


現代企業的數據量越來越大,應用越來越多,他們開始面臨當年 Google 遇到的問題,CIO 要考慮怎麼更高效的構建自己的計算和存儲的基礎架構,來滿足應用的數據訪問需求。

虛擬化爲更容易的管理應用而生,它解決了 CPU、內存資源閒置的問題。但隨着虛擬化的大規模應用,虛擬機越來越多,虛擬機在傳統存儲上運行卻越來越慢了。“慢”造成“體驗差”,“體驗差”成爲了限制虛擬化應用的最大的瓶頸。這裏面的最重要原因自然是,存儲的 I/O 性能不夠,大量的虛擬機和容器同時運行,I/O 的混合,使得隨機讀寫急劇增加,傳統存儲的結構無法承受大量的隨機 I/O。


超融合恰恰是爲了解決這個問題,才被帶到了虛擬化和容器領域。同時,業內也存在不同的解決 I/O 問題的方法,這裏先嚐試分析下其他的解決方法:

  • 解決方法一:在存儲設備採用 SSD 做  Cache,加速I/O。這在一定的規模下可能有效,但是存儲設備的 SSD Cache 通常比例較小,不足 5% 的容量比的情況下,自然滿足不了用戶的熱數據的緩存需求。另外,仍然無法隨需擴展,所有的數據仍然要從集中的存儲控制器流出,這個集中的“收費站”勢必堵塞“高速公路”。

  • 解決方法二: 使用服務器側 SSD 做 Cache,加速 I/O。這種類似的解決方案,通常缺乏高可靠性軟件的支撐,服務器端的 Cache 如果用做寫 Cache,存在單點失效的問題,需要在多個服務器的 Cache 設備上,做副本來提供可靠性,可以說這是一個閹割版的超融合架構,將 Cache 放到服務器端,仍然使用傳統存儲,當 Cache 滿,需要被寫回傳統存儲的時候,仍然被傳統存儲的“控制器”限制整體性能。


可以看到,上面的兩種方案都是受限於傳統存儲的結構,超融合存儲則不一樣,通過完全去掉傳統存儲,利用分佈式文件系統來提供“不可限量”的性能和容量,在這個基礎上,再通過 Cache 進行加速,甚至全部使用閃存(全閃存產品)來構建都是自然而然,不被限制了。


因此,超融合架構不是爲了讓單臺服務器的存儲飛快,而是爲了讓每增加一臺服務器,存儲的性能就有線性的提升,這樣的存儲結構纔不限制企業業務的運行,並保證業務的可靠性。

超融合架構IO.png

超融合將存儲池化,性能線性提升


正因爲這種擴展性很好的共享存儲,使得整個 Google 的業務得以順暢地運轉。SmartX 在做的就是這樣的更好的、更穩定的基礎服務。


另外,超融合近幾年得以快速發展的原因,這要歸功於硬件設備。CPU 核數越來越多,服務器的內存容量越來越大,SSD 設備和網絡互聯網設備越來越快,這意味着:

  1. 服務器的資源除了運行業務以外,仍然可以預留出來足夠的 CPU,內存資源來運行存儲軟件。將存儲軟件和業務運行到一塊,既減少了設備量,減少了電力使用,本地讀取也提高了 I/O 的存取效率。這在幾年前是做不到的,因爲 CPU 和內存太有限了。

  2. 網絡互聯越來越快,無論是萬兆,40Gb 以太網,還是 Infiniband(無限寬帶技術),使得超融合能夠將獨立的存儲設備進行互連,通過分佈式文件系統形成共享的存儲池,供上層應用使用。

  3. 如果說 SSD 等硬件廠商讓單個存儲設備跑的更快,超融合的意義就在於,讓超大量的這些存儲設備一起工作,提供無止境的整體性能和容量。


瞭解更多超融合產品相關信息可訪問 SmartX 官方網站:https://www.smartx.com



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章