CTO 深度解讀 SMTX OS 3.5 產品特性

注:本文內容整理自 SmartX CTO 張凱在 SMTX OS 3.5 新品發佈會上的演講。

我們最近發佈了一個很重要的產品版本——SMTX OS 3.5,在這裏爲大家做詳細的介紹。在此之前,先簡單介紹一下大家比較關注的超融合外部市場的情況以及 SmartX 的市場進展,這些市場進展都是我們做產品迭代及市場拓展的重要依據。

超融合對傳統 IT 架構的顛覆已成必然

如果說前幾年超融合還處於市場教育階段,那近兩年隨着客戶案例的增多,用戶對超融合的適用性和價值越來越明確,我們能明顯感覺到市場進入真正的爆發式增長階段。

無論是 Gartner 還是 IDC,都預測全球超融合市場將保持近 50% 複合增長率的迅猛勢頭,並在 2020 年達到近百億美金的市場規模。

當然,越來越多的廠商也看到了這個趨勢並進入超融合市場,讓競爭愈加激烈。這一必然趨勢的背景都源自於超融合架構在敏捷性、易用性、性能等相比傳統三層 IT 架構給用戶帶來的價值是質的提升。

SmartX 在彎道上穩步超車

SmartX 作爲從 2013 開始就一直專注超融合的廠商,也受益於這個顛覆性的市場機會。到目前爲止,我們除了擁有聯通沃雲這樣的中國最大超融合案例,也獲得了類似海爾、泰康人壽、國泰君安等金融、製造業的頭部客戶,這些客戶客戶原來在使用類似 EMC、VMware、Dell 等 IT 巨頭的產品,但是現在逐漸開始採用我們的超融合產品替代原有的架構,不僅應用在開發測試環境,還包括生產環境。實現這樣的成績不僅源自於我們在這個方向的專注,更因爲超融合對傳統IT架構顛覆的必然性。

另一個值得一提的事情是,2018 Q1 IDC 的報告顯示,SmartX 在金融行業的超融合市場已經位居前三甲。金融行業是我們將進一步聚焦的行業方向,我們堅信在這個市場最能全面檢驗產品的可靠性與價值,也能獲得最具代表性的用戶反饋,同時我們 3.5 的一些重要的產品特性也源自於金融領域的實際市場需求。

關於 SMTX OS

首先介紹一下,SMTX OS 是我們軟件產品的商標,目前已經在中國以及海外的主要國家註冊。SMTX OS 當前是超融合架構的核心軟件,未來會是企業雲核心操作系統。雖然大家都在說大而全的企業雲的概念,但我們相信正如亞馬遜的成功起步於 “EC2”,做好計算、存儲的這些核心纔是有效構建企業雲的第一步,目前我們的主要精力和資源都是在構建這個企業雲的 “EC2”。
CTO 深度解讀 SMTX OS 3.5 產品特性
圖一. SMTX OS 未來將成爲超融合企業雲操作系統

爲什麼發佈 SMTX OS 3.5

SMTX OS 之前已經經歷了 1.0、2.0、3.0 階段。1.0 和 2.0 是我們在 2017 年之前的版本,他們的亮點核心是在超融合下面的分佈式塊存儲。中國最大的超融合案例聯通沃雲的核心就是來自於 2.0 的版本,應該說運行是非常穩定的,整個超融合包括分佈式存儲預期的彈性可擴展、高性能、低延遲、易管理,都獲得了非常充分的體現。

到了 3.0 的版本,是在覈心的分佈式塊存儲的基礎上構建了完整的超融合產品,這裏面增強了很多產品化的內容,包括超融合在虛擬化層面的增強,包括像 VMware、Xenserver 更多虛擬化版本的支持,這些超融合先進的理念,都在此版本中得到實現。現在很多客戶,比如金融客戶、大型製造業客戶都是通過 3.0 的版本來切入的。
CTO 深度解讀 SMTX OS 3.5 產品特性
圖二. SMTX OS 版本演進

但客戶還是有一個問題,就是關於超融合架構是否能夠完全地替代現有的一些傳統 IT 的基礎設施的架構?無論傳統架構還是超融合架構,用戶在考慮 IT 基礎設施的時候需求是相同的,希望能夠簡化 IT 的複雜度,同時降低 TCO,提升整個 IT 基礎設施的敏捷度,以應對快速增長的互聯網時代的快速業務增長。這樣就能夠把更多的精力從原來的 IT 基礎設施的運維、管理等,轉移到專注於自己業務本身的創新以及發展。目前的超融合已經能較好地滿足以上大部分需求。不過對於一些核心應用場景,像核心的數據庫、生產系統,用戶希望能夠達到和傳統 IT 方案匹配的 RPO、RTO 和容災能力,但是同時還要保持超融合敏捷、易用等優勢。

我們想要做的或者產品目標就是幫助用戶把核心業務系統在超融合架構上更好地使用起來,並且獲得更好的體驗。這樣一方面可以享受到超融合本身帶來的包括簡化 IT、降低 TCO 的好處,同時也避免產生像傳統架構與超融合架構混合存在於 IT 基礎架構裏複雜的情況。

還要特別強調一下關於容災能力,我們從低到高不同的級別可以劃分成比如單個磁盤的故障容災、單節點容災、單故障、單個數據中心以及城域的故障。對於核心的應用系統來說,當然要求不僅僅提供單磁盤、單節點、單機架故障的容災能力,同時要提供站點級別以及城域級別的容災能力,這也是 3.5 裏面所要發佈功能的重點。接下來我會依次介紹一下 3.5 裏面所提供的一些比較重點的功能。

SMTX OS 3.5 五大特性解析

特性一:雙活集羣

首先介紹的重要點是雙活集羣,剛纔我們提到了 IT 基礎設施需要不同的容災保護。雙活集羣實際上是 SMTX OS 3.5 裏爲了應對站點級別的故障、同城站點故障所推出的功能。

我們看一下雙活集羣的部署模式。首先我們需要在一個城市中的兩個不同的數據中心裏分別部署 SMTX OS 集羣,同時這裏面要求兩個站點之間的 RTT 要小於 5 毫秒。同時我們需要在第三個站點裏面去部署仲裁節點,仲裁節點主要是用於解決當集羣的 IT 系統出現腦裂的時候做仲裁,決定哪個站點應該是唯一存在的站點。

在底層的數據上做到實時同步才叫所謂的雙活,這樣可以實現同城多個數據中心實現 RPO=0,秒級 RTO 級別的保證。當其中一個站點發生故障的時候,上面所運行的業務或所運行的 VM 會被自動通過我們系統所提供的 HA 功能,自動恢復到另外一個站點,這樣就能夠實現業務的連續性。

這裏強調一個很重要的點,也是發佈 3.5 一直貫通的主題,我們提供的雙活或雙活的功能不僅僅是指存儲層面的雙活。首先我們的雙活集羣是完全依賴於底層雙活存儲的功能,也就是說數據是在兩個不同的站點之間,而且實時能夠同步。更主要的是除了提供存儲層面的雙活之外,還對整個 IT 基礎設施提供了站點級別的保護。這個 IT 基礎設施包含的存儲、虛擬化、網絡以及一些監控部署等等支撐的業務。也就是說我們在一個超融合的軟件架構裏面,提供了完整的 IT 基礎設施的雙活功能,或者說是站點級別的容災功能。

當我們的一個站點發生故障的時候,不僅僅是數據能夠保證 RPO=0,秒級 RTO 級別,VM 是可以漂移過去的。同時我們虛擬機管理的功能、網絡管理功能,以及容災、監控、報警等等所有的功能,都可以在另外一個站點自動去恢復。這個是我們認爲超融合所帶來的巨大好處。傳統 IT 的部署方式,我們的虛擬化、存儲、網絡,包括一些支撐的系統,可能每一個系統都來自於不同廠家,每個廠家的產品在部署的時候都需要有自己獨立的配置或者是雙活部署的要求。我們如果想要達到整個 IT 基礎設施的雙活或者站點容災的保護,就需要針對每一個產品去做獨立配置。同時因爲產品和產品之間有一定的依賴性,所以我們想把 IT 基礎設施做成站點保護的時候是非常複雜的。而因爲 SMTX O S是一個超融合的架構,裏面提供了所有的一站式的功能,你只需要在我們的界面裏面做簡單的雙活的配置,就可以實現 IT 基礎設施容災的保護,這個就實現了我們所強調的簡化提升核心系統在超融合上的使用體驗,大大降低了 IT 管理員平常的運維負荷度。

特性二:數據的備份與異地災備

上面是我們雙活集羣的介紹,接下來介紹數據的備份以及異地災備,剛纔提到雙活實際上是指同城雙活,我們有一個嚴格要求是兩個站點之間的 RTT 必須要小於 5 毫秒。因爲這個限制,所以導致雙活只能在同城之間做數據保護。有時候企業有更遠距離的異地災備的保護需求,這個時候我們通過在 3.5 裏提供的數據備份和異地災備的功能來滿足要求。

首先來看一下部署的模式,在部署的時候我們可以在不同的城市,比如在 A 城市和 B 城市分別部署 A 站點和 B 站點,把我們現在 VMware 所運行的 A 站點稱爲保護站點,把 B 站點稱爲備份站點。如果我們想要對 A 站點的業務或虛擬化做保護的話,只需要在管理界面上通過創建保護計劃來選擇需要保護的對象。我們需要保護的對象,可以保護一個或一組保護對象。保護對象也有兩種不同的類型,包括用戶的虛擬化,就是 VM,我們以 VM 爲例對業務做保護,也可以選擇獨立的虛擬卷做保護。

當我們在創建保護計劃的時候,選擇完保護對象就可以選擇備份的時間、備份的間隔,比如最低可以提供 1 小時的備份間隔,比如說可以選擇 B 站點作爲備份的目標站點,這樣就完成了保護計劃的創建。當創建完保護計劃以後,SMTX OS 的系統就會定期在保護站點裏面對 VM,或者對選擇的保護對象做快照。當快照結束以後,會把變更的數據通過增量以及壓縮的方式傳輸到備份站點。

假設當我們的站點 A 發生故障的時候,用戶可以選擇在站點 B 通過界面的操作把 VM 恢復,這樣就可以保證業務的連續性。因爲我們備份的間隔目前是一小時,所以能夠達到小時級別的 RPO,同時 RTO 整體來說是在分鐘級別。

除了我們可以把數據備份出去以外,還可以支持當 A 站點恢復的時候,我們可以把數據從 B 站點再拉回或同步回到 A 站點,因爲 B 站點可能是災備站點,資源是有限的。當 A 站點恢復的時候,自然希望把數據還是運行在 A 站點,我們只是需要在界面上操作把數據同步回來,這個業務就遷移到 A 站點的保護站點。

更進一步的是我們不僅僅支持從 A 站點到 B 站點的備份,也可以支持到 B 站點到 A 站點的備份,也就是說我們的備份是雙向的。除此之外可以多站點多對多的備份,一個 A 站點可以同時備份到 B 站點和 C 站點,以提供更高級別的容災保護能力。

在我們所提供的數據備份和異地災備功能裏面,我們保護的內容不僅僅是數據,而是以業務爲出發點去考慮業務的延續性。當我們被保護的對象比如 VM 本身發生一些配置變更的時候,這個配置的變更也會自動被同步到備份站點。

我們舉個例子,假設在 A 站點使用 VM 時,一開始創建保護計劃時只有兩個虛擬卷。隨着我們不斷使用和業務的擴展,我們希望再增加一個虛擬卷,也就是三個虛擬卷,同時上面運行了一些業務。這個時候在下一次做數據同步和備份過程中,除了把新增的虛擬卷裏面的內容同步到備份站點以外,同時還會把虛擬機增加一個虛擬的操作變更同步到遠程站點,當遠程站點啓動虛擬機構時候同時加載三個虛擬盤,這樣避免了有些數據運行在新增的數據盤上,可能啓動的時候會有一些問題,這也是最大化保證業務的延續性,也就是從業務的角度出發進行數據的保護。

這個是我們提供的 SMTX OS 3.5 跨城市數據保護和容災功能。這兩個功能從目前所看到的情況,都是隻有很少的超融合廠商才能夠具備,而且是完全不同於傳統存儲廠商角度做的保護,我們是從整個 IT 基礎設施的角度做的數據保護。

特性三:虛擬機管理

接下來我們來介紹一下虛擬化,超融合裏面三個最主要的模塊:計算、存儲、網絡,計算指的就是虛擬化。大家如果之前瞭解過我們的話,我們在虛擬化的平臺支持上還是很豐富的,包括 VMware、Xenserver 的平臺以及內嵌的 KVM 的平臺,都可以提供很好的超融合的部署和支持。這裏更強調自身提供的基於 KVM 的內嵌的虛擬化平臺,這是高度定製化的,而且做了很多深度優化和集成的平臺,提供了我們認爲最佳的易用性以及最好的用戶體驗。

在 3.5 的版本里面也對內部的虛擬化功能做了很大的增強,我簡單地通過四點來介紹。

首先是放置組的功能。當集羣規模比較大,尤其是當用戶使用核心業務的時候,比如說像 Oracle RAC 場景,其實要求每一個虛擬機或業務所運行的節點有特殊限制,比如說 Oracle RAC 兩個 VM 希望運行在不同的物理節點上,或者有些特殊的要求是運行在相同的物理節點上。針對這種需求,我們提供了放置組的功能,根據用戶提供的放置策略幫助你選擇 VM 到底運行在哪個節點上。

這個結合了我們下面提供的自動化調度功能,自動化調度是說當我創建 VM 的時候,其實用戶不需要手動去選擇或指定運行在哪個節點,系統會根據兩個條件來自動選擇。第一個條件是用戶所定義的放置組的功能,看你到底屬於哪一個放置組策略,看怎麼定義你的放置規則。同時結合當前集羣內部每一個節點的壓力,包括 CPU 的壓力、內存的壓力等等,我來選擇一個負載儘可能低的節點去運載當前的業務。

第三個功能是 VM HA 的功能,作爲虛擬化管理平臺 VM HA 是很基礎的功能。我們在之前的 3.0 版本里面,提供了可靠性的保證是在剛發生故障切換的時候,保證 5 分鐘之類一定可以把虛擬化業務自動 HA 到另外一個可運行的節點上。在 3.5 版本里面做了進一步提升,把 5 分鐘限制降低到 3 分鐘,也就是說你的業務當發生故障的時候,最多有 3 分鐘故障的切換時間,整個速度上我們提升了 40%。

第四,同時我們也提供了基於虛擬化批量的創建,以及批量遷移的操作,這也是進一步在用戶體驗上的提升。

特性四:塊存儲服務

塊存儲服務,在 3.5 之前塊存儲服務只服務於超融合內部的虛擬化服務,比如說在上面建一個虛擬機,虛擬機是可以直接使用到超融合架構底層的池化存儲能力。但其實我們在跟客戶溝通交流的時候遇到一個問題,客戶實際的生產環境中運行的應用系統的環境要求是複雜多樣的。比如有些系統必須是運行在物理機上,有些系統希望運行在容器裏面,比如 K8S、Docker 裏面,這都是有可能的。有些是運行在虛擬化環境裏面,有些是運行在超融合裏面。我們有沒有可能把客戶多種多樣不同的需求,尤其是對存儲的需求能夠統一管理和集成起來。

我們在 3.5 裏面爲了滿足客戶的需求,我們就提供了塊存儲的服務,顧名思義把 SMTX OS 本身所提供的塊存儲的能力,通過 iSCSI 標準接口對外輸出。這樣對於外面是不管是物理機、容器、K8S 或其他的應用環境,只需要通過標準的 iSCSI 協議,就可以訪問到我們超融合集羣裏面存儲的能力,這就是塊存儲服務。

塊存儲帶來了什麼的好處呢?首先我們可以看到最明顯的,因爲 SMTX OS 本身的塊存儲功能非常強大,包含的數據保護的功能,剛纔提到了本身包含了單磁盤、單節點、單機架的保護功能,以及 3.5 推出了雙活功能,以及跨地域容災保護功能。這些功能都可以繼續被複用,只要採用了超融合的塊存儲服務,也可以享受這些的存儲功能。同時 SmartX 分佈式塊存儲裏面像穩定、簡單、可靠、有彈性、易擴展,這些功能也都是包含在本身的塊存儲服務裏面。
CTO 深度解讀 SMTX OS 3.5 產品特性
CTO 深度解讀 SMTX OS 3.5 產品特性
圖三/四. 一個 OS 整合穩態與敏態業務

特性五:全新界面設計與運維功能增強
CTO 深度解讀 SMTX OS 3.5 產品特性
圖五. SMTX OS 3.5 軟件界面

此外,我們來介紹一下關於 3.5 版本里面全新設計的界面,以及比較強大易用的運維管理功能。首先是增加了多集羣管理很重要的功能,我們現在很多客戶其實在使用 SMTX OS 產品的時候,已經是多個集羣,最多的客戶可能有很多集羣需要同時管理。當他需要管理多個集羣的時候,我們在 3.5 裏面就提供了多集羣管理,就是在一個界面可以同時管理 SMTX OS 所有的集羣。

同時我們在提供了一個更高級的監控分析以及報警的功能,在這個版本里面提供了超過 200 個計算、存儲、網絡以及相關的指標監控和統計,以及變化的趨勢。同時提供了 TopK 的分析,可以快速找到哪些虛擬機或數據卷是被訪問頻繁的,哪些是熱點虛擬化,我們根據統計來做一些規劃或者部署。我們還提供了監控面板的自定義,用戶可以自定義希望看到的監控面板和報警屬性,比如說報警可以根據哪些條件去做。

還有包括硬件資產的報表導出,這是很實用的功能,很多客戶會遇到資產統計的問題。此外,還可以智能識別節點佈局和硬件磁盤的位置,還支持第三方服務拓撲的可視化。

模塊化授權模式與更廣泛硬件適配

以上是我們關於 3.5 新功能、新產品最重要內容的介紹,下面介紹的是關於 License 這一方面,大家如果熟悉其他的產品,像一般 IT 產品提供 License 的時候不是那麼靈活,比如基礎版、增強版、加強版等等,每一個不同的版本里麪包含的是一組功能。當你想要高級功能的時候不能只爲一個功能付費,要爲一組功能付費,可能有一些功能不是你需要的。我們根據客戶的需求,提供了更加靈活的 License 授權的方式,也就是我們的整體 License 是授權到企業版,企業版包含了 3.5 裏面所有的基礎功能,包括本身的虛擬化、網絡、存儲等等功能,高級功能包括雙活、異地災備,通過獨立的 License 的方式去進行授權。比如客戶只需要雙活的保護,你只需要對雙活一個功能付費就可以了。如果只需要異地災備的功能,只需要購買異地災備的 License,而不需要打包強制賣給你一些你並不需要的功能,這個是根據用戶的需求來定製的很靈活的 License 的模式。
CTO 深度解讀 SMTX OS 3.5 產品特性
圖六. 靈活的 license 模式與最新硬件平臺的廣泛適配

同時我們在這個版本里做了硬件兼容性的適配,包含了主流的硬件廠商型號,包括像聯想、浪潮、戴爾、超威、華爲以及惠普的一些最主流的機型支持。從硬件磁盤的角度來講,SSD 上支持了英特爾、三星、東芝,最主流的 SSD 型號都可以支持。

3.5 版本總結

對於我們 3.5 來做一個總結,我們首先從幾個角度對業務功能做了加強,包含了虛擬化、運維和 Web 界面都是做了很好的加強,同時也推出了一些新的功能,包括塊存儲、雙活、異地容災功能。

在這裏還是要再強調一下,我們之所以能夠推出這些功能,一方面是因爲提供了超融合的架構,能夠提供最好的用戶體驗,幫助用戶把他核心的生產系統儘可能遷移到超融合架構裏面;同時因爲我們有自己的產品研發團隊,才能夠在這麼短的時間裏面把這些功能,把很重要、很難開發的功能快速推出來,這就是我們認爲和其他的超融合廠商很大的區別。
CTO 深度解讀 SMTX OS 3.5 產品特性
圖七. SMTX OS 3.5 極大拓展價值邊界

當我們發佈了 3.5 以後,其實我們的產品價值邊界就得到了極大的擴展。我們認爲目前 SMTX OS 3.5 的產品,實際上是極具全球競爭力的超融合產品。我們支持了虛擬化場景到裸金屬場景,包括穩態、敏態、單數據中心、多數據中心、容災的要求以及簡單易用的要求等等。

SMTX OS 的未來規劃

以上是我們對 3.5 產品的介紹,實際上到現在爲止我們已經有一些客戶在使用 3.5 版本的產品。我們目前的研發團隊,已經開始去對未來的版本,包括對 4.0 版本以及 4.0 之後的版本去做更進一步的新功能的開發和設計。開發和設計的目標,也還是圍繞着剛纔提到的讓用戶的核心應用系統更好地在超融合裏面得到更好的體驗,這就是我們的產品始終不變的目標。
CTO 深度解讀 SMTX OS 3.5 產品特性
圖八. SMTX OS 未來發展

可以看一下上圖,我們目前的產品發展思路是這樣的,首先底層提供了四個最核心的基石的模塊,其中上面是塊存儲功能,下面是虛擬化功能,左邊是零運維管理(非常強大的自動運維管理功能),以及數據保護和容災功能。有這四個基礎的功能以後,實際上可以覆蓋的場景就包含了像服務器虛擬化、塊存儲,服務像 VDI、ROBO、核心業務場景的應用,這些場景我們就可以得到覆蓋了。對於一些更高級產品的用戶的需求,其實後面還會發展到包括備份生態的集成,我們會開放一些存儲訪問和備份的接口,我們支持向第三方被廠家能夠和 SMTX OS 產品做集成,由他們去備份我們超融合裏面的數據。同時也會提供一些像二級存儲的應用。

其次有一些更核心的應用場景,像核心的數據戶應用場景對性能的需求是非常高的,也包括了現在全閃的趨勢也是越來越明顯,所以我們會進一步在全閃和提供全閃場景下 SLA 的保證。以及根據企業雲的發展思路,會提供權限管理包括多租戶、自服務等等高級功能,幫助一個大型企業的IT基礎設施去做很好的運維和管理。

最後我們還會進一步去拓展整個的生態,包括對 K8S 容器的支持,包括提供應用中心,我們也支持第三方廠家能夠把他的一些應用內嵌到超融合架構產品裏面來。通過我們互相的合作,能夠給用戶帶來最完美的超融合體驗。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章