上篇:用戶行爲數據採集 第9節 總結
架構圖
數據集市與數據倉庫的區別
第1章 電商業務與數據結構簡介 1.1 電商業務流程 1.2 電商常識(SKU、SPU) SKU=Stock Keeping Unit(庫存量基本單位)。現在已經被引申爲產品統一編號的簡稱,每種產品均對應有唯一的SKU號。 SPU
當今的數據處理大致可以分成兩大類:聯機事務處理OLTP(on-line transaction processing)、聯機分析處理OLAP(On-Line Analytical Processing)。OLTP是傳統的關係型數據
上篇:用戶行爲數據採集 第1節 日誌生成代碼編寫 1、Hadoop安裝 詳見:hadoop集羣搭建(完全分佈式詳細版) 1)集羣規劃: 服務器flink105 服務器flink106 服務器flink107 HDFS Nam
上篇:用戶行爲數據採集 第8節 項目經驗之Flume內存優化 1、數倉概念總結 數據倉庫的輸入數據源和輸出系統分別是什麼? 輸入系統:埋點產生的用戶行爲數據、JavaEE後臺產生的業務數據。 輸出系統:報表系統、用戶畫像系統、推
上篇:用戶行爲數據採集 第5節 日誌採集分析、ETL攔截器、分類型攔截器及腳本編寫 1、Kafka安裝 架構圖 Kafka集羣安裝 詳見:參照自己上次寫的博客: Kafka集羣部署 集羣規劃: 服務器hadoop1.x
上篇:用戶行爲數據採集 第 3 節 項目經驗之Hadoop參數調優 1、Zookeeper安裝 詳見參照:zookeeper分佈式安裝部署 集羣規劃 服務器flink105 服務器flink106 服務器flink107 Zoo
上篇:用戶行爲數據採集 第2節 基準測試 1、 HDFS參數調優hdfs-site.xml (1)dfs.namenode.handler.count=20 * log2(Cluster Size),比如集羣規模爲8臺時,此參數設
1、創建Maven工程 創建log-collector 工程創建ok,如圖所示: log-collector模塊代碼編寫 在pom.xml文件中添加如下內容 <!--版本號統一--> <properties
上篇: 用戶行爲數據採集 第4 節 完全分佈式的 zk、 xcall、dt、lg腳本編寫 1、Flume採集 安裝Flume 上傳Flume壓縮包 [root@hadoop1 hadoop]# ll total 54408 -r