數據的哲學,數據從哪裏來,到哪裏去

《數據時代2025》這篇報告的題目很有意思:兩個副標題,第一個是說,數據的重要性將演化爲“性命攸關的”(Life-Critical)。第二個副標題是說,不要過分集中關注在“大數據”上,要關注“數據的大”。而這兩點,正是整篇報告最關注的的兩個重點:數據的重要性和數據量的激增。

說到這裏,可能很多朋友都要說,唉,這都是老生常談了。身在IT領域,現在還有人不知道數據的重要性嗎?而數據量的增長對於IT管理,特別是存儲領域,也不是什麼新聞了。剛開始我也是這麼以爲的,但是讀完整篇報告,還是有了一些新收穫。

我們先說一說數據的大。2025年全球產生的數據量將達到163ZB。這個數字是剛剛過去的2016年全球產生數據總量的10倍。

這麼多的數據從哪裏來?報告中把數據來源分成了三個部分:核心(即企業數據中心和企業雲的數據),邊緣(核心數據中心外的其它企業系統),終端(PC、手機、傳感器、照相機、智能汽車等)。

終端佔比目前雖然很大,未來卻會逐年下降。換句話說,企業數據的增長速度甚至比剛纔提到的10倍增長速率還要更快。這可能與我們的直覺並不相符。但是,仔細想一想還是很合理的。首先,雖然大量的終端設備(如手機)還在不停地產生數據,但是這些數據不重要的部分會被隨時刪掉,而重要的部分會上傳到各種雲中,由某個企業或者雲變成企業數據進行存儲。另外,大數據分析在企業的應用會逐漸加速,而這些應用利用數據產生新的數據,使得企業數據量迅速增加。

另外,還有一個有趣的現象是,企業的邊緣產生的數據速度遠超過核心數據中心。究其原因,還是因爲數據分析的需要。數據越來越多來自於移動數據,需要分析本地的數據,而且要求越來越實時快速。這樣,分散在各地的機器就比大型數據中心集中處理更有優勢。舉例來說,各種針對所在位置的服務,其數據必須是實時分析的結果,這樣的話把系統分佈在全國各地,可能就比一個巨型數據中心效果好很多。而這,也是這些年來軟件定義存儲帶來的好處,不論數據實際位置,都方便進行管理,而也可以隨需動態進行遷移。利用FreeStor的存儲抽象化功能,不論任何廠商,任何架構,任何介質,任何地點,甚至任何公有云和私有云,都可以把所有的存儲資源打通並進行統一管理。只有這樣的管理架構才能應對未來如洪水般涌來的數據的挑戰。而用戶在架構設計、設備採購、介質選擇以及向公有云遷移的策略和實施上,獲得無以倫比的自由度和彈性。

再來看一看我們這些存儲行業的人最關心的問題,這麼多數據,到底要存放在哪裏呢?

這些數據會更多存放在企業裏。娛樂數據會迅速減少(因爲藍光和DVD會大面積被視頻點播所取代),PC也會明顯下降,雖然移動終端的數據量會迅速上升,但是從比例上來看,更多的數據份額會被企業吃掉。最終到2025年,企業數據會佔到所有數據存儲量的50%以上。這相對於2016年只有大約30%的份額來說,是一個巨大的提升。所以,雖然過去這一年全球的企業級存儲市場處於停滯甚至萎縮的狀態,未來企業對於存儲的需求還是巨大的。當然,未來的企業存儲不一定還是以今天主流的存儲陣列的形式而存在。

報告認爲,數據量的增長速度會遠超過存儲設備本身能力的增長。所有的存儲設備,甚至整個存儲架構都需要不斷擴容和升級,而不能指望硬盤和存儲陣列本身存儲能力的提升。因此,未來幾年企業的存儲架構會比今天更加複雜。

再來看看存儲介質的變化。

光學介質和磁帶會進一步萎縮,閃存會高速發展,但是直到2025年,硬盤還會佔據大約一半的市場份額。但是請注意一點,圖中的統計是以容量(byte)爲單位,而不是以銷售額爲單位的。存儲相同容量的硬盤可能是閃存的幾倍,如果這個趨勢保持不變,那麼從銷售額的角度來看,到2025年,閃存可能會是硬盤存儲的好幾倍。

總結一下前面的這些分析。

1、2025年這未來幾年,數據量會激增10倍;

2、企業產生和存儲的數據量增長會比這個速度還要高;

3、爲了應對數據量的增長,企業存儲會比今天更加複雜;

4、企業核心數據中心以外的邊緣數據中心將是數據增長的重要來源;

5、閃存存儲設備未來會高速發展成爲比硬盤存儲設備大得多的市場。

企業存儲需求日益複雜,而且隨着業務需求和存儲技術的不斷變化,企業存儲在制定策略時必然要面對越來越多的不確定性。比如:

1、今天的存儲採購要支持的業務系統,未來幾年很可能會變成私有云或者乾脆上公有云;

2、今天的存儲採購只需要100塊磁盤的配置,但是隨着業務發展,很可能要變成上千塊磁盤的規模;

3、今天的閃存還很貴所以只能小範圍應用,隨着閃存價格和容量的改進,未來幾年要大面積更換介質;

4、今天的數據存儲都集中在覈心數據中心,但是未來因爲數據分析的需要,可能要在全國建設幾十上百個小型數據中心或者專用系統。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章