1、SDS科普
SDS(Software Defined Storage)即軟件定義存儲,簡單地說就是將存儲硬件和軟件進行分離,採用標準化硬件作爲載體(如X86架構),基於軟件實現企業級存儲功能和服務。
相對於傳統存儲硬件盒子,SDS中存儲軟件成爲了核心。SDS通常都是分佈式存儲,形式分爲文件存儲(POSIX/NFS/CIFS)、對象存儲(S3)和塊存儲(iSCSI/iSER/NVMeoF)三種。
SDS的興起源於硬件的快速發展,CPU、網絡、SSD等硬件成熟度、穩定性、性能不斷提升,同時雲計算對存儲擴展性、可靠性、高性能、低成本的迫切需求,從而使得SDS成爲可能。
從雲計算到傳統行業,從邊緣到核心業務,SDS目前已經成爲存儲市場主流,替換傳統SAN/NAS存儲,即去IOE運動。SDS的產品模式分爲獨立存儲和HCI超融合兩種,後者中SDS決定着HCI的核心競爭力。
SDS開源軟件和商業系統,可謂百家爭鳴,多爲面向HDD機械硬盤或SSD混合型容量存儲。隨着SSD技術和成本不斷演進,新一代性能型全閃SDS即將成爲主流趨勢。同時,智能化SDS發展趨勢凸顯,即第五代智能存儲。
2、發展簡史
2003年,Lustre 1.0發佈,一款面向HPC的開源高性能集羣並行文件系統。
2006年,Gluster誕生,最初目標是代替Lustre和GPFS分佈式文件系統。
2009年,Nutanix公司發佈具有專利的超融合基礎架構,公認爲HCI鼻祖。
2010年,Sheepdog發佈,一款極簡風格的開源分佈式塊存儲系統。
2011年,Sage Weil創立了Inktank公司主導Ceph的開發和社區維護。
2012年,Pure Storage發佈第一代AFA全閃存陣列,引領全閃存儲潮流。
2014年,VMWare正式發佈VSAN第一個版本,內嵌於vSphere內核中。
2014年,FhGFS改名爲BeeGFS,並在中小型HPC系統中得到關注和應用。
2014年,MinIO發佈,一款極簡風格的開源高性能分佈式對象存儲系統。
2015年,這年前後中國涌現一批基於開源Gluster/Ceph/BeeGFS的存儲初創公司。
2015年,被普遍認爲是中國SDS/HCI市場的元年,整個市場呈現高速增長的局面。
2017年,Qumulo發佈新一代高性能全閃存文件存儲系統,面向百億級別文件數量應用。
2017年,這年前後中國涌現一批巨頭入場,基於開源Ceph研發SDS存儲產品。
2019年,根據IDC統計數字SDS/HCI已經成爲市場主流,佔據超過1/3外部存儲市場份額。
2020年,信創產業開始將SDS納入產品名錄,中國市場出現新一代性能型全閃SDS產品。
3、技術流派
本身SDS產品技術路線而言,國內開源存儲佔了大多數,分爲六大技術流派,各顯神通。
Lustre,開源高性能並行文件系統,波瀾不驚的20+年發展歷程,常青樹標杆。
Lustre最大特點就是可擴展的高性能,尤其TB級超高帶寬,以及MPI並行支持。
Lustre缺陷同樣非常明顯,系統複雜性極高,數據可靠性過度依賴硬件。
Lustre專注高性能並行計算場景,幾乎佔據HPC TOP500半壁天下。
Lustre正在發展全閃存架構、集羣元數據、副本/糾刪碼冗餘機制,以突破更高帶寬、百億級小文件、Share-nothing架構下數據高可用等挑戰。
Gluster,極簡架構的開源分佈式文件系統,目標是替換Lustre/GPFS,最爲廣泛流行。
Gluster最大特點是簡單可靠,獨特去中心架構下的高彈性擴展能力,更低硬件要求。
Gluster最明顯的不足是海量文件下的元數據檢索能力,小I/O能力不太夠。
Gluster非常適合大文件帶寬型應用場景,比如媒體資源、視頻監控、HPC,適用面寬泛。
Gluster正在優化大規模集羣管控、海量元數據管理、容器持久化存儲、混合雲存儲等功能,以拓寬更多的應用場景。
Sheepdog,極簡架構的開源分佈式塊存儲系統,專爲KVM/QEMU設計,曇花一現。
Sheepdog最大特點同樣是簡單易用,無中心架構擴展能力強,專注做好塊存儲功能。
Sheepdog顯著短板是高級存儲特性不足,背後無公司運營,系統穩定成熟度不夠。
Sheepdog專爲QEMU虛擬機設計,適用OpenStack,也可作爲獨立iSCSI塊存儲設備。
Sheepdog起點較早,2015年前後曾經發展勢頭很不錯,2018年基本停滯,甚是可惜。
Ceph,開源分佈式統一存儲系統,追求完美架構,因OpenStack和對象存儲成爲雲計算寵兒。
Ceph最大特點是統一存儲,同時支持塊兒、對象和文件存儲,高級存儲功能規格全面。
Ceph最大問題同樣是統一存儲,系統架構複雜度極高,文件功能一直未能達到生產成熟度。
Ceph最佳應用場景是OpenStack,天然生態融合,對象存儲應用比較廣泛已經超越塊存儲。
Ceph正在努力優化其文件系統成熟度、降低I/O延遲、支持高速網絡和新型存儲介質,以適應雲計算的快速發展步伐。
BeeGFS,開源高性能分佈式文件系統,Lustre挑戰者,HPC領域存儲新秀。
BeeGFS最大特點是開放硬件架構下的高性能,相對Lustre/GPFS更加靈活易用和更高擴展性。
BeeGFS不足之處是同樣是系統複雜性極高,性能之外的高級存儲功能缺失比較多。
BeeGFS聚焦HPC高性能計算場景(尤其是中小型),目前已經在TOP500/IO500嶄露頭角。
BeeGFS正在發展混合雲化環境文件存儲服務、全閃存架構性能優化、AI場景化應用優化,以及高級存儲功能,以拓寬HPC高性能計算之外的更多應用場景。
Minio,極簡架構的開源分佈式對象存儲系統,AWS S3兼容最好的開源實現,對象存儲新貴。
Minio最大特點是輕量可靠,專注做好對象存儲,獨特擴展模式獲得更高擴展性和易維護性。
Minio被詬病最多的同樣是按集羣擴展模式,單個桶無法擴容,僅支持EC糾刪碼延遲較大。
Minio主要應用場景爲人工智能、大數據分析、雲原生應用、數據備份容災等。
Minio正在發展對接更多雲生態應用、對象存儲混合雲化服務、高性能硬件環境下的性能優化,更好幫助構建雲原生數據基礎架構,並承載更多關鍵核心應用。
4、技術門檻
存儲圈流傳這樣一個說法,搞存儲是一個危險係數很高的職業。爲啥呢?計算出問題通常都是局部單機故障,重啓試試大概率就能解決,而存儲一旦出問題就是全局系統故障,搞不好就成背鍋俠。存儲作爲IT基礎設施的底座,重要性不言而喻,誰整誰知道。
存儲圈內人士總是對存儲有無窮的敬畏,越是大牛越是如此。而存儲圈外人士往往低估存儲的門檻,認爲只要投錢花時間就能搞出牛逼的存儲產品。這裏面直接忽略了科學理論、工程技術的系統複雜性和人的決定性因素。如果是這樣,哪有什麼卡脖子關鍵技術一說。
存儲系統軟件是一個複雜的系統軟件工程,需要嚴謹的理論架構和工程化來保證數據安全性和系統穩定性,存儲的底線和紅線是不允許丟失數據。存儲算法理論、系統架構、硬件結構、操作系統、軟件工程等各個環節都非常複雜。系統複雜性決定了存儲研發不可能是一件容易的事,對於存儲新產品技術要在無人區不斷摸索和試錯,對理論創新、系統架構、工程化能力要求很高,這些都直接決定了存儲的極高門檻。
就存儲產品技術而言,中國至少落後硅谷一代,時間上真不大好估算,有些技術我們是壓根沒有掌握。國內存儲採用開源路線居多,同質化現象極爲嚴重,研發上採用Follow對標跟隨策略,創新領先的東西極少,並沒有出現類似硅谷百家爭鳴的景象。這些同樣佐證了存儲門檻很高,一定要有客觀清醒的認知。
5、全閃SDS
SSD固態硬盤技術成熟度和先進性不斷增強,成本不斷下降,取代大部分HDD機械硬盤是必然結果。第五代智能存儲發展趨勢,全閃滿足不斷提升的性能型場景需求和企業數字化轉型。從存儲顆粒芯片、主控芯片到主控軟件,SSD能夠實現完全國產化,而機械硬盤無法做到,全閃存是信創產業實現國產化存儲替換的必由之路。
2015年被普遍認爲是中國SDS/HCI市場的元年,整個市場呈現高速增長的局面,2019年根據IDC統計數字認爲SDS/HCI已經成爲市場主流,佔據超過1/3的外部存儲市場份額。同時,全閃存儲(全閃陣列AFA和全閃SDS)成爲主流趨勢,佔用外部存儲市場的半壁江山。2020可能會成爲中國全閃存的發展元年,多家存儲廠商發佈了新一代的AFA全閃陣列,TaoCloud則發佈了FASS新一代性能型全閃SDS產品。
全閃SDS特點是高性能,尤其是隨機讀寫、低延遲和高帶寬,主要用於高性能場景。
- 雲計算:雲基礎設施加速,高速雲存儲,幫助核心業務上雲;
- 金融科技:數據庫加速,高性能容器存儲,幫助去IOE和國產化替換;
- 新基建:5G、AI、物聯網、工業互聯網,解決新興行業性能痛點需求;
- 其他:4K/8K高清非編、HPC、海量小文件,滿足行業技術升級需求;
全閃存趨勢已經很明顯,全閃和混閃在SDS中佔比已經達到50%。分佈式全閃存硅谷代表創業公司有Pure Storage、kaminario、Excelero、E8、Qumulo、Wekaio、Elastifile,國內目前全閃SDS產品鳳毛麟角。全閃存如果已經是絕對主流,那意味着再入場可能爲時已晚,2020年正當時。
6、免費開源
SDS開源軟件發展繁榮興盛,諸如Lustre、Gluster、Sheepdog、Ceph、BeeGFS、Minio六大技術流派,國內存儲廠商幾乎或多或少都享受着開源存儲軟件紅利。開源軟件降低了存儲研發的門檻,基於成熟的開源存儲系統可以快速構建起具有一定競爭力的存儲產品體系,實現市場佈局和自主可控國產化。藉助開源軟件打造存儲,無非是出於幾種考慮,或是看好順應開源大勢,或是圖快吃紅利,或是認爲研發成本低,或是沒有能力自主研發。
採用SDS開源存儲軟件同樣面臨諸多巨大挑戰。開源系統本身複雜性高,吃透並且能夠掌握難度是挺大的,通常都是跟隨社區主導者的步伐發展。越是火熱的開源存儲,越是市場上同質化更加嚴重,容易陷入價格戰的惡性競爭而非技術取勝,同質化競爭導致市場分散也限制了廠商的發展上升空間。開源軟件需要嚴格遵守開源許可,尤其是走向國際化市場。另外,開源模式並不意味着免費或低成本。
對於國內存儲廠商尤其是初創公司,自主研發SDS產品並且擁有完全知識產權的,實際上可以考慮免費和開源模式。這種模式下,技術先進性和世界頂級公司保持一致,降低全球化的門檻,從國內走向國際化,符合軟件模式發展趨勢。商業模式上來看,藉助數字化新營銷,免費軟件模式能夠實現零成本廣泛獲客,通過服務訂閱和商業軟件轉化。
SDS軟件定義存儲的核心是軟件,支持部署在裸金屬、私有云、公有云及混合雲上。SDS的理想目標是,簡單穩定好用低成本,發展方向是免費開源軟件和SaaS公有云化。當然,縱觀開源社區,免費開源的關鍵在於誰來主導,掌控者得大發展(比如Redhat,也有例外),跟隨者吃點紅利小發展。
7、競爭格局
國內SDS產品基於開源路線爲主,Ceph佔絕對多數,其他有Gluster和BeeGFS。幾乎全部都是第一代容量型SDS,落後硅谷一代技術,自研產品少。以下競爭格局根據廠商公開資料和存儲圈內資訊整理而成,如有出入敬請撥正。
巨頭企業:
華爲:FusionStorage(參考Ceph,塊存儲)、OecanStor 9000(參考Ceph,文件存儲)
浪潮:AS13000(開源Ceph,重點是文件存儲)
新華三:OneStor(開源Ceph,塊和對象存儲)
曙光:Parastor(自研,文件系統,HPC場景)
深信服:EDS(開源Gluster+Ceph,塊存儲、文件和對象存儲)
初創公司:
TaoCloud:XDFS(開源Gluster,以文件存儲爲主),FASS(自研,新一代全閃塊存儲)
XSKY:SDS系列產品(開源Ceph,塊和對象存儲)
杉巖:SDS系列產品(開源Ceph,塊和對象存儲)
鵬雲:ZettaStor DBS(自研,塊存儲)
霄雲:BOSS(自研,統一存儲)
焱融:YRCloudFile(開源BeeGFS,文件存儲)
龍存:Loong系列(自研,文件系統,HPC場景)
8、未來展望
數字世界那麼大,存儲必然有好發展。
2020年可能是全閃存儲發展元年,全閃存已經是大勢所趨,國內市場會加速度發展。
新興技術、產業升級、新基建、信創產業,新興需求驅動細分應用感知智能存儲發展。
第五代智能存儲,業界基本形成共識,人工智能技術將顛覆存儲技術走向新境界。
預測未來的最好方法是創造它,JUST DO IT!