配置Hive on Spark

原創

2018-12-04 21:13

需求場景

對hive進行記錄數統計以及獲取ddl語句均需通過spark engine，配置Hive on Spark予以支持。

工作流程

添加spark服務；
配置需要使用spark的hive：Spark On YARN Service選項選擇已創建的spark服務並保存；
配置完成後順序執行如下操作關閉hive、spark服務，重啓YARN服務，然後啓動spark，hive服務
客戶端使用需先執行spark引擎設置語句：set hive.execution.engine=spark

操作步驟

安裝spark service

登錄Cloudera Manager 如：http://172.16.50.21:7180/
配置hive
重啓服務

驗證配置

通過ssh登錄hive節點服務器，進入hive終端
設置engine：set hive.execution.engine=spark
執行相應sql,正確得到結果，如：select count(*) from table;

參考資料

cdh官方配置hive on spark：https://www.cloudera.com/documentation/enterprise/5-10-x/topics/admin_hos_oview.html#concept_i22_l1h_1v

cdh添加service：https://www.cloudera.com/documentation/enterprise/5-10-x/topics/cm_mc_add_service.html#cmug_topic_5_1

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

最新文章

最新評論文章