macOS下 Hive 2.x 的安裝與配置

1 簡介

Hive是基於Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,並提供簡單的[SQL]查詢功能,可以將SQL語句轉換爲MapReduce任務進行運行。其優點是學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計分析。

它提供了一系列的工具,可以用來進行數據提取轉化加載(ETL),這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。Hive 定義了簡單的類 SQL 查詢語言,稱爲 HQL,它允許熟悉 SQL 的用戶查詢數據。同時,這個語言也允許熟悉 MapReduce 開發者的開發自定義的 mapper 和 reducer 來處理內建的 mapper 和 reducer 無法完成的複雜的分析工作。

Hive 沒有專門的數據格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允許用戶指定數據格式。

Apache Hive起初由[Facebook]開發,目前也有其他公司使用和開發Apache Hive,例如[Netflix]等。亞馬遜公司也開發了一個定製版本的Apache Hive,亞馬遜網絡服務包中的Amazon Elastic MapReduce包含了該定製版本。

2 環境

  • 操作系統

macOS下 Hive 2.x 的安裝與配置

  • Hadoop版本
    hadoop-2.6.0-cdh5.7.0

  • MySQL版本
    macOS下 Hive 2.x 的安裝與配置

  • mysql-connector-java
    5.1.37

  • Hive版本
    2.3.4

3 安裝Hive

3.1 先確保已經正確安裝並運行了hadoop

3.2 下載Hive安裝包

官網下載

將安裝包移動至:
../hadoop-2.6.0-cdh5.7.0/ 目錄下,此目錄是本地安裝Hadoop的目錄

移動至此處後,解壓縮

  • tar -xzvf apache-hive-2.3.4-bin.tar.gz
    macOS下 Hive 2.x 的安裝與配置

並將解壓後的文件名改爲hive,方便配置。

例如本機Hive的安裝路徑爲
macOS下 Hive 2.x 的安裝與配置

3.3 配置系統環境變量

3.3.1 修改~/.bash_profile

// 或者修改/etc/profile文件

vim ~/.bash_profile

添加內容

export HIVE_HOME=/Volumes/doc/hadoop-2.6.0-cdh5.7.0/hive
export PATH=$PATH:$HIVE_HOME/bin:$HIVE_HOME/conf

退出保存後,在終端輸入,使環境變量立即生效

source ~/.bash_profile

4 修改Hive配置

4.1 新建文件hive-site.xml

  • 在 ../hive/conf下
    macOS下 Hive 2.x 的安裝與配置

  • 添加hive-site.xml內容
    macOS下 Hive 2.x 的安裝與配置

4.2 hive-env.sh

  • 複製hive-env.sh.template爲hive-env.sh
    macOS下 Hive 2.x 的安裝與配置

  • 修改hive-env.sh內容
    macOS下 Hive 2.x 的安裝與配置

5 MySQL 權限配置

5.1 給用戶賦予權限

  • 以使得該用戶可以遠程登錄數據庫:
    macOS下 Hive 2.x 的安裝與配置

    如果上面查詢到有信息,但host爲localhost或其他值,就需要根據實際需求來更新表信息

    grant all privileges on 庫名.表名 to '用戶名'@'IP地址' identified by '密碼' with grant option;
    flush privileges;

    庫名:要遠程訪問的數據庫名稱,所有的數據庫使用“
    表名:要遠程訪問的數據庫下的表的名稱,所有的表使用“

    用戶名:要賦給遠程訪問權限的用戶名稱
    IP地址:可以遠程訪問的電腦的IP地址,所有的地址使用“%”
    密碼:要賦給遠程訪問權限的用戶對應使用的密碼

GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' WITH GRANT OPTION;

使改變立即生效:

FLUSH PRIVILEGES;

macOS下 Hive 2.x 的安裝與配置

6 向/usr/hadoop/hadoop-2.6.2/hive/lib中添加mySql連接庫:

6.1 官網下載連接驅動包

6.2 將下好的包解壓縮

  • 解壓後,將此文件夾下mysql-connector-java-8.0.15.jar
    macOS下 Hive 2.x 的安裝與配置

  • 複製到../hive/lib下
    image.png

注意:需要給/tmp文件夾設置寫權限,同時確保 hadoop不在安全模式下,可以執行此命令使hadoop退出安全模式:hadoop dfsadmin -safemode leave

7 啓動Hive

在命令行運行 hive 命令時必須保證HDFS 已經啓動。可以使用 start-dfs.sh 腳本來啓動 HDFS。

7.1 如果是第一次啓動Hive,則需要先執行如下初始化命令

schematool -dbType mysql -initSchema

macOS下 Hive 2.x 的安裝與配置

7.2 啓動Hive

macOS下 Hive 2.x 的安裝與配置

完成基本的環境配置!

X 交流學習

macOS下 Hive 2.x 的安裝與配置

Java交流羣

博客

知乎

Github

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章