blink+tablestore實現無限擴展性,高實時彙總計算及排行榜

問題背景

最近開始了一個全新的ugc項目,要求對用戶的點贊,評論,轉發等等的數據進行統計按權重進行積分,並進行排序。要求排行榜的實時性在5分鐘內,最好能進行全實時的計算,要求高度的準確性。
實際工作中這樣的場景是非常多的,主要是各種數據的實時彙總,比如用戶購買總量,用戶點贊總量,
商品銷售總量,不是要歷史的數據而是要現在最新的總量數據,這個數據可能是1天的彙總,也可能是數年的彙總。另一方面是進一步依靠這些數據進行排行榜和推薦,將最熱最火的信息推送給用戶。
現在這樣的數據彙總計算排行通常的方案是Lambda架構,用戶數據既需要進入消息隊列系統(New Data Stream如metaq)作爲實時計算任務的輸入源,又需要進入數據庫系統(All Data如HBASE)來支持批處理系統,最終兩者的結果寫入數據庫系統(MERGED VIEW),展示

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章