讀書筆記——阿里數據中臺(第一篇:數據中臺頂層設計)

最近在讀阿里數據中臺的書,因爲要在組內做分享,就多度了幾遍。與阿里大數據實踐之路配合,基本可以看到阿里建設數據中臺的過程,和一些技術細節。做一件有價值的事情就是把自己覺得好的東西分享出來,那麼開始內容

(1)大數據的發展歷程和價值探索

大數據的發展

文章開篇是一段作者建設數據中臺過程的心路歷程,下來就是老套路,介紹了國內外大數據發展的歷程與大數據的價值探索,這裏做簡單的介紹。


兩個重要的節點需要說一下

  1. 2003年穀歌公開了內部對於海量文件的處理技術、GFS分佈式文件系統、並行計算處理框架MapReduce、高效數據存儲模型BigTable,這些促成了分佈式系統基礎架構---hadoop。爲各個大數據組件的誕生打下基礎。
  2. 2012年全球大數據從TB上升到PB,也是阿里大數據之路開端的一年。

大數據的價值

大數據的價值書中主要從四個方面介紹,在下面的四個方面都深刻的解析了大數據的實際應用和真是含義。

  1. 語義層面:‘數據’即所有信息的記錄,例如用戶訪問網站的信息的轉化過程的行爲屬性;大是巨量的意思,可以隱身爲數量、形式、含義的豐富,保障實現被高保真的記錄與回放
  2. 實現層面:大數據是一套數據處理技術活方法體系,實現具體以上特徵的數據的存儲、計算、共享、備份和容災、保密等,保證數據處理的時效性和拓展性
  3. 服務層面:大數據的數據技術變革引發的新型信息服務模式,例如從數據探索出發,系統主動推送信息給用戶做決策、給及其優化參數、基於數據的量變完成數據的質變
  4. 應用層面:大數據是數據服務組合生成的新場景、新體驗、日益增長的數據量非但不會使信息獲取效率降低、質量下降,反而會讓每個人都能得到快速的迭代,個性化的互聯網服務。

(2)阿里的大數據主張

在數據提供服務的基礎上,阿里對數據的要求是準、快、全、統、通,簡單的解釋是標準統一
融會貫通、資產化、服務化、閉環自優,這是阿里數據中臺實現目標的核心。



要實現上面的目標,如何做呢?
圖片展示了數據中臺運行的過程,主要抽象成三個部分
第一部分:OneData致力於實現數據的標準與統一
第二部分:OneEntity致力於實現實體的統一,讓數據融通而非以孤島存在,爲精準的用戶畫像提供基礎
第三部分:OneService致力於實現數據服務統一,讓數據複用而非複製

從兩一個維度看一下數據中臺賦能業務的全景圖


  • 數據後臺:計算數據後臺同時具有離線計算、實時計算計算能力和在線分析能力從而可以讓用戶今早的看見昨天及以前彙總及萃取的數據,準確無誤的看到上一秒產生的數據、在線分析,查看海量的數據
  • 數據中臺:雲上數據中臺、通過智能數據能力實現全局數據倉庫規劃、數據規範定義、數據建模研發、數據連接萃取、數據運維監控,擁有多樣的數據的分層數據中心。
  • 數據前臺:數據前臺的核心是通過數據的複用,爲多個業務線提供數據高效的數據服務。

——————————————————————————————————————
今天就介紹到這裏,下次介紹阿里巴巴的大數據建設過程,主要以時間爲主線介紹。
附下篇文章地址,感興趣可以繼續查看
https://www.jianshu.com/p/fe573eacb822

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章