R語言 一遍讓你搞定R連接Hive以及hive的可視化工具

關注微信公共號:小程在線

關注CSDN博客:程志偉的博客

 

R語言連接Hive、hive的可視化工具

最重要的就是找對相應的jar,我會在微信公共號上列出詳細的jar名稱,不必加載所有的jar包。

 

一、R語言連接Hive

 

1.設置工作目錄,並加載需要的包

setwd('F:\\00czw\\20200628hive\\')
library('rJava')
library('DBI')
library('RJDBC')


2.f變量加載的是jar包所在的目錄,修改相應的地址,用戶名和密碼


f<-list.files("F:\\00czw\\20200628hive", pattern = "jar$", full.names=TRUE)
drv<-JDBC("org.apache.hive.jdbc.HiveDriver",f)
conn<- dbConnect(drv, sprintf('jdbc:hive2://IP地址:10000/medical_gaomi'),'用戶名','密碼')

3.連接好之後,開始讀取數據導入R,涉及數據問題,不展示數據樣子


data <-dbGetQuery(conn,"select  * from  test")


4.關閉連接,每次讀取完數據,要關閉連接


dbDisconnect(conn)

 

二、hive的可視化工具配置,我在本機以實現

關於hive的可視化工具配置部分轉載於: http://lxw1234.com/archives/2015/09/519.htm

剛看到一個可以連接Hive的客戶端界面工具–SQuirrel SQL Client,試了一下,用起來還行,在這裏記錄一下安裝及使用方法。

SQuirrel SQL Client是一個用Java寫的數據庫客戶端,用JDBC統一數據庫訪問接口以後,可以通過一個統一的用戶界面來操作MySQL、PostgreSQL、MSSQL、Oracle、Hive等等任何支持JDBC訪問的數據庫。使用起來非常方便。而且,SQuirrel SQL Client還是一個典型的Swing程序,也算是Swing的一個比較成功的應用了。

當然,可以在windows中來連接Hive。

在使用SQuirrel SQL Client鏈接Hive之前,首先確保HiveServer2服務已經啓動,並且有訪問權限。

SQuirrel SQL Client的官網及下載地址爲:http://squirrel-sql.sourceforge.net/

目前最新版本爲3.7,可以在http://squirrel-sql.sourceforge.net/#installation頁面下載jar包squirrel-sql-3.7-standard.jar

下載後,雙擊squirrel-sql-3.7-standard.jar,即可啓動安裝程序。

安裝到這一步,需要勾選簡體中文:

SQuirrel SQL Client

繼續往下,直至安裝完畢。從開始菜單中打開SQuirrel SQL Client,點擊最左側的”Drivers”驅動tab頁,點擊添加(+)來添加Hive的驅動配置:

SQuirrel SQL Client

在彈出的添加驅動對話框中填入Hive的驅動信息:

SQuirrel SQL Client

注意:在”Extra Class Path”中,需要加入運行Hive所依賴的jar包,我這裏將$HIVE_HOME/lib/下的所有jar包,以及Hadoop的核心jar包,

還有slf4j的兩個jar包都添加進去。最後點擊OK確定。

接着,進入最左側的”Aliases”別名tab頁面,點擊添加(+),建立一個Hive的鏈接:

SQuirrel SQL Client

在彈出的添加別名對話框中,填入以下信息(Driver選擇上面新建的HiveDriver):

SQuirrel SQL Client

點擊OK確定之後,彈出鏈接對話框:

SQuirrel SQL Client

點擊”Connect”鏈接Hive。鏈接成功之後,首頁如下:

 

 

雙擊左側的Objects下面的TABLE標籤,即可列出Hive中所有的表:

SQuirrel SQL Client

選中一個表,可以看到該表的概要信息。

切換到SQL標籤頁,可以在這裏編輯和執行SQL:

SQuirrel SQL Client

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章