1、Hive架構
Hive架構圖如下:
其中②爲元數據存儲。Hive將元數據存儲在數據庫中,如MySQL、Derby等,其中元數據存儲依賴於Metastore DB服務。Hive中的元數據包括表名、表的列和分區及其屬性、表的屬性(是否爲外部表)、表的數據所在目錄等。
2、數據庫
Hive安裝的三種模式:
- 內嵌模式:元數據保持在內嵌的Derby模式,同一時間只允許一個會話連接;
- 本地獨立模式:在本地安裝Mysql,把元數據放到Mysql內,同一時間允許多個會話連接;
- 遠程模式:元數據放置在遠程的Mysql數據庫;
所以,學習階段,選擇MySQL作爲Hive存儲MetaStore的數據庫最佳!