Hadoop 2.x 四層架構


一、存儲層:文件系統HDFS,NoSQL Hbase

二、資源及數據管理層:YARN以及Sentry等

三、計算引擎MapReduce、Impala、Spark等

四、基於MapReduce、Spark等計算引擎的高級封裝及工具:Hive、Pig、Mahout等


Sqoop (Sql to Hadoop) 被設計爲支持批量從結構化數據存儲導入數據到HDFS,如關係數據庫,企業級數據倉庫和NoSQL系統。

Flume 用於移動大規模批量流數據到 HDFS 系統。從Web服務器收集當前日誌文件數據到HDFS聚集用於分析
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章