大數據分析引擎:Hive(蜂巢),支持SQL(表:數據模型)
1、什麼是Hive?
(*)Hive是基於HDFS之上的一個數據倉庫
Hive HDFS
表 目錄
數據 文件
分區 目錄
桶 文件
(*)Hive是一個翻譯器,默認,把SQL ----> MapReduce
(*)Hive支持SQL的一個子集。
2、hive的體系結構
hive是通過sql最後翻譯成mapreduce程序來執行數據分析的
我們也可以創建hive on spark