Hadoop2.8+HBase2.0+ZooKeeper3.4分佈式集羣環境搭建

Hadoop+HBase+ZooKeeper分佈式集羣環境搭建

參考借鑑了該博主的博客:https://blog.csdn.net/lisonglisonglisong/article/details/46974723#t0

概述

本次 Hadoop 集羣安裝實驗,採用在 VMware 虛擬機下安裝多個 CentOS 系統的
方式進行;3 個 CentOS 系統中,其中,1 個爲 Master 機,作爲 NameNode;另外 3
個爲 Slave 機,作爲 DataNode,均採用獨立靜態 IP 地址配置。

1. 安裝準備

1.1 軟件系統清單

序號 名稱 描述
1 jdk-8u171-linux-i586.tar.gz 所有環境都需要的配置 地址
2 VMware 虛擬機安裝程序,這裏採用 VMware12 模擬測試 地址
3 CentOS-7-x86_64-DVD-1804.iso 集羣操作系統 地址
4 hadoop-2.8.3.tar.gz Hadoop 安裝程序 地址
5 hbase-2.0.0-bin.tar.gz HBase 安裝程序 地址
6 zookeeper-3.4.12.tar.gz 集羣分佈式應用程序協調服務 地址

以下是hbase官網提供的Hbase和Hadoop版本兼容信息 參考

  • “S” = supported(支持)
  • “X” = not supported(不支持)
  • “NT” = Not tested(未測試)
HBase-1.2.x HBase-1.3.x HBase-1.5.x HBase-2.0.x HBase-2.1.x
Hadoop-2.4.x S S X X X
Hadoop-2.5.x S S X X X
Hadoop-2.6.0 X X X X X
Hadoop-2.6.1+ S S X S X
Hadoop-2.7.0 X X X X X
Hadoop-2.7.1+ S S S S S
Hadoop-2.8.[0-1] X X X X X
Hadoop-2.8.2 NT NT NT NT NT
Hadoop-2.8.3+ NT NT NT S S
Hadoop-2.9.0 X X X X X
Hadoop-2.9.1+ NT NT NT NT NT
Hadoop-3.0.x X X X X X
Hadoop-3.1.0 X X X X X

1.2 IP 地址配置清單

集羣環境至少需要3個節點(也就是3臺服務器設備):1個Master,2個Slave,節點之間局域網連接,可以相互ping通,下面舉例說明,配置節點IP分配如下:

Hostname IP User Password
master 192.168.1.60 root root
weiqi1 192.168.1.61 root root
weiqi2 192.168.1.62 root root

三個節點均使用CentOS-7系統,爲了便於維護,集羣環境配置項最好使用相同用戶名、用戶密碼、相同hadoop、hbase、zookeeper目錄結構。

2. 準備工作

2.1 關閉防火牆

關閉firewalld防火牆:

$ systemctl status firewalld.service	#檢查防火牆狀態
$ systemctl stop firewalld.service		#關閉防火牆
$ systemctl disable firewalld.service	#禁止開機啓動防火牆

關閉iptables防火牆:

$ systemctl status iptables			#檢查防火牆狀態
$ systemctl stop iptables				#關閉防火牆
$ systemctl disable iptables			#禁止開機啓動防火牆

2.2 安裝JDK

上傳jdk-8u171-linux-i586.tar.gz安裝包到根目錄下新建的weiqi文件夾中,

進去到weiqi目錄下,解壓安裝包:

$ tar -zxvf jdk-8u171-linux-i586.tar.gz

配置java環境變量,打開/etc/profile文件

$ nano /etc/profile 

添加如下配置:

export JAVA_HOME=/weiqi/jdk1.8.0_171
export PATH=$JAVA_HOME/bin:$PATH export 
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar 

然後重新加載配置文件使之生效:

$ source /etc/profile 

檢查java環境是否配置成功:

$ java -version

看到如下響應說明環境OK:

java version "1.8.0_171"
Java(TM) SE Runtime Environment (build 1.8.0_171-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.171-b11, mixed mode)

####################################################################################
# 注:因爲下載失誤,下載了32位的jdk的同學,使用java、javac 檢驗java環境時提示爲
# [root@master weiqi]# java
# -bash: /weiqi/jdk1.8.0_171/bin/java: /lib/ld-linux.so.2: bad ELF interpreter: 沒有那個文件或目錄
# 也別擔心,僅需要安裝64位程序編譯即可:
####################################################################################

yum install glibc.i686

2.3 添加Hosts映射關係

分別在三個節點上修改hosts映射關係:

$ nano /etc/hosts     

添加的內容如下:

192.168.1.60 master
192.168.1.61 weiqi1
192.168.1.62 weiqi2

2.4 集羣之間SSH無密碼登陸

CentOS默認安裝了ssh,如果沒有你需要先安裝ssh 。

集羣環境的使用必須通過ssh無密碼登陸來執行,本機登陸本機必須無密碼登陸,主機與從機之間必須可以雙向無密碼登陸,從機與從機之間無限制。

主要有三步:①生成公鑰和私鑰、②導入公鑰到認證文件、③更改權限

分別在各個主機上生成密鑰:

$ ssh-keygen -t rsa 								//生成祕鑰  

在weiqi1上:

$ cp ~/.ssh/id_rsa.pub ~/.ssh/weiqi1.id_rsa.pub		//複製備份
$ scp ~/.ssh/weiqi1.id_rsa.pub master:~/.ssh		//拷貝到master準備認證

在weiqi2上:

$ cp ~/.ssh/id_rsa.pub ~/.ssh/weiqi2.id_rsa.pub		//複製備份
$ scp ~/.ssh/weiqi2.id_rsa.pub master:~/.ssh		//拷貝到master準備認證

在master 上:

$ cd ~/.ssh
$ cat id_rsa.pub >> authorized_keys
$ cat weiqi1.id_rsa.pub >>authorized_keys			//導入到認證文件
$ cat weiqi2.id_rsa.pub >>authorized_keys			//導入到認證文件
$ scp authorized_keys weiqi1:~/.ssh					//更改權限 
$ scp authorized_keys weiqi2:~/.ssh					//更改權限 

測試:

[root@master ~]# ssh weiqi1
Last login: Tue Jul 10 16:50:05 2018 from 192.168.1.97
[root@weiqi1 ~]# 

[root@master ~]# ssh weiqi2
Last login: Tue Jul 10 16:50:06 2018 from 192.168.1.97
[root@weiqi2 ~]# 

可通過exit退回到master上

3. Hadoop集羣安裝配置

3.1 安裝置配置Hadoop

3.1.1 安裝Hadoop

上傳hadoop-2.8.3.tar.gz安裝包到weiqi文件夾下

解壓安裝包:

$ tar -zxvf hadoop-2.8.3.tar.gz

進入到hadoop-2.8.3下:

分別創建如下相關文件:

$ mkdir hdfs
$ mkdir hdfs/data		//DataNode存放文件夾
$ mkdir hdfs/name		//NameNode存放文件夾
$ mkdir hdfs/tmp		//數據臨時存放文件夾

進入到etc/hadoop目錄下,分別修改如下配置文件

3.1.2 配置core-site.xml

nano core-site.xml

<configuration>
    <!-- 指定hdfs的nameservice爲master -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>
    <!--指定hadoop數據臨時存放目錄-->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/weiqi/hadoop-2.8.3/hdfs/tmp</value>
    </property>
</configuration>

3.1.3 配置hadoop-env.sh

$ nano hadoop-env.sh

#添加JDK路徑
export JAVA_HOME=/weiqi/jdk1.8.0_171

3.1.4 配置hdfs-site.xml

$ nano hdfs-site.xml

<configuration>
	<!-- 設置hdfs中存放NameNode的文件路徑 -->
    <property>
		<name>dfs.namenode.name.dir</name>
        <value>file:/weiqi/hadoop-2.8.3/hdfs/name</value>
    </property>
    <!-- 設置hdfs中存放DataNode的文件路徑 -->
    <property>
	<name>dfs.datanode.data.dir</name>
        <value>file:/weiqi/hadoop-2.8.3/hdfs/data</value>
    </property>
    <!-- 指定hdfs保存數據的副本數量 -->
    <property>
		<name>dfs.replication</name>
        <value>2</value>
    </property>
</configuration>

3.1.5 配置mapred-site.xml

$ nano mapred-site.xml

<configuration>
	<!-- 連接jobtrack服務器的配置項 -->
    <property>
		<name>mapred.job.tracker</name>
        <value>master:9001</value>
    </property>
    <!-- 告訴hadoop以後MR(Map/Reduce)運行在YARN上 -->
    <property>
		<name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

3.1.6 配置yarn-env.sh

$ nano yarn-env.sh

#添加JDK路徑
export JAVA_HOME=/weiqi/jdk1.8.0_171

3.1.7 配置yarn-site.xml

$ nano yarn-site.xml

<configuration>
	<!--nomenodeManager獲取數據的方式是shuffle-->
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
	<!--指定Yarn的老大(ResourceManager)的地址-->
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>master</value>
	</property>
	<!--Yarn打印工作日誌-->
	<property>
		<name>yarn.log-aggregation-enable</name>
		<value>true</value>
	</property>
</configuration>

3.1.8 配置 slaves

$ nano slaves

weiqi1
weiqi2

3.2 部署他其他節點

$ scp -r /weiqi/hadoop-2.8.3 weiqi1:/weiqi/hadoop-2.8.3
$ scp -r /weiqi/hadoop-2.8.3 weiqi2:/weiqi/hadoop-2.8.3

3.3 分別配置Hadoop環境變量

$ nano /etc/profile

添加:

#配置Hadoop環境變量
export HADOOP_HOME=/weiqi/hadoop-2.8.3
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_YARN_HOME=$HADOOP_HOME
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

然後重新加載配置文件使之生效:

$ source /etc/profile 

3.4 格式化namenode

進入master,格式化namenode,第一次啓動服務前執行的操作,以後不需要執行。

$ hdfs namenode -format

如出現包含以下結果,說明格式化成功了:

***************************************************
************has been successfully formatted
***************************************************

/**
* 注:如果沒有出現successfully 等字符串,只要整個格式化過中沒有拋出異常也是能正常運行的,
* 我後面重新配置了一個環境,提示的是:
* 19/02/23 16:02:05 INFO namenode.NameNode: SHUTDOWN_MSG: 
* /************************************************************
* SHUTDOWN_MSG: Shutting down NameNode at hbase1/192.168.136.100
* ************************************************************/
* 在這段信息上面有個警告提示
* 19/02/23 16:02:04 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
* Formatting using clusterid: CID-905d7034-eecc-4197-9ce7-7a4eebd9a263
* 網上有教程說配置 hadoop-env.sh和yarn-env.sh 這兩個文件中添加如下兩行代碼
	export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_PREFIX}/lib/native
	export HADOOP_OPTS="-Djava.library.path=$HADOOP_PREFIX/lib"
* 但是沒有生效,不知道配置的版本不對還是位置不對,但無關大局,不會影響整個環境的運行,請放心使用
* 當然,這個問題不修復,在啓動Hadoop時也會又該警告,也是無語了
* /

同時,也能在master的/weiqi/hadoop-2.8.3/hdfs/name生成了current文件夾

3.5 啓動Hadoop

進入master

#若配置了環境變量
$ start-all.sh
-------------------------------------
若沒有配置環境變量
進入:/weiqi/hadoop-2.8.3/
$ sbin/start-all.sh

3.6 啓動成功標誌

在master上使用jps命令:

$ jps

[root@master ~]# jps
10499 Jps
1511 SecondaryNameNode
1321 NameNode
1659 ResourceManager

在weiqi1和weiqi2上使用jps命令

$ jps

[root@weiqi1 ~]# jps
1234 DataNode
1336 NodeManager
6524 Jps

同時也能在瀏覽器上通過http://192.168.1.60:50070web端查看Hadoop信息

這裏寫圖片描述

或者通過http://192.168.1.60:8088web端查看Hadoop信息

這裏寫圖片描述

3.7 關閉Hadoop

關閉 master節點上的 hadoop

[root@master sbin]# stop-all.sh

4. ZooKeeper集羣安裝配置

4.1 安裝配置 Zookeeper

上傳zookeeper-3.4.12.tar.gz安裝包到weiqi文件夾下

解壓安裝包:

$ tar -zxvf zookeeper-3.4.12.tar.gz

進入到zookeeper-3.4.12下:

分別創建如下相關文件:

$ mkdir data		//zookeeper數據存放文件夾
$ mkdir logs		//zookeeper日誌存放文件夾

進入到conf目錄下,複製zoo_sample.cfgzoo.cfg

$ cp zoo_sample.cfg zoo.cfg

zoo.cfg文件下修改添加如下配置:

dataDir=/weiqi/zookeeper-3.4.12/data

server.0=master:2888:3888
server.1=weiqi1:2888:3888
server.2=weiqi2:2888:3888

4.2 部署其他節點

分別複製zookeeper-3.4.12到其他節點下:

$ scp -r /weiqi/zookeeper-3.4.12 weiqi1:/weiqi/zookeeper-3.4.12
$ scp -r /weiqi/zookeeper-3.4.12 weiqi2:/weiqi/zookeeper-3.4.12

分別配置每臺主機的zookeeper環境變量:

$ nano /etc/profile

添加:

#配置zookeeper環境變量
export ZOOKEEPER_HOME=/weiqi/zookeeper-3.4.12
export PATH=$PATH:$ZOOKEEPER_HOME/bin:$ZOOKEEPER_HOME/conf

然後重新加載配置文件使之生效:

$ source /etc/profile 

分別在每臺主機的/weiqi/zookeeper-3.4.12/data目錄下創建myid文件,同時和zoo.cfg文件中的server對應,mastermyid中填0weiqi1myid1weiqi2myid2,

如下:

master下:

[root@master ~]# nano /weiqi/zookeeper-3.4.12/data/myid
  GNU nano 2.3.1                        文件: /weiqi/zookeeper-3.4.12/data/myid                
0

weiqi1下:

[root@weiqi1  ~]# nano /weiqi/zookeeper-3.4.12/data/myid
  GNU nano 2.3.1                        文件: /weiqi/zookeeper-3.4.12/data/myid                
1

weiqi2下:

[root@weiqi2 ~]# nano /weiqi/zookeeper-3.4.12/data/myid
  GNU nano 2.3.1                        文件: /weiqi/zookeeper-3.4.12/data/myid                
2

4.3 啓動ZooKeeper集羣

在ZooKeeper集羣的每個節點上,執行啓動ZooKeeper服務的腳本:

#若配置了環境變量
$ zkServer.sh start
-------------------------------------
若沒有配置環境變量
進入:/weiqi/zookeeper-3.4.12
$ /bin/zkServer.sh start

查看服務是否啓動成功:

#若配置了環境變量
$ zkServer.sh status
-------------------------------------
若沒有配置環境變量
進入:/weiqi/zookeeper-3.4.12
$ /bin/zkServer.sh status

成功狀態如下:

貌似leader節點是隨機分配的:

[root@master ~]# zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /weiqi/zookeeper-3.4.12/bin/../conf/zoo.cfg
Mode: leader

follower

[root@weiqi1 ~]# zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /weiqi/zookeeper-3.4.12/bin/../conf/zoo.cfg
Mode: follower

4.4 啓動成功標誌

在master上使用jps命令:

$ jps

[root@master ~]# jps
2063 QuorumPeerMain

在weiqi1和weiqi2上使用jps命令

$ jps

[root@weiqi1 ~]# jps
1593 QuorumPeerMain

4.5 關閉Zookeeper

關閉 master節點上的 zookeeper 和 weiqi1,weiqi2節點的 zookeeper 的命令式一樣的。
命令如下:

[root@master bin]# zkServer.sh stop

5. HBase集羣安裝配置

5.1 安裝配置HBase

5.1.1 安裝 HBase

上傳hbase-2.0.0-bin.tar.gz安裝包到weiqi文件夾下

解壓安裝包:

$ tar -zxvf hbase-2.0.0-bin.tar.gz

進入到hbase-2.0.0-bin下:

進入到conf目錄下,分別修改如下配置文件

5.1.2 配置hbase-env.sh

$ nano hbase-env.sh

#指定Java路徑
export JAVA_HOME=/weiqi/jdk1.8.0_171
#配置hbase日誌輸出地址
export HBASE_LOG_DIR=${HBASE_HOME}/logs
#指定Hadoop配置
export HBASE_CLASSPATH=/weiqi/hadoop-2.8.3/etc/hadoop
#禁用默認的zookeeper,使用單獨的zookeeper
export HBASE_MANAGES_ZK=false

5.1.3 配置hbase-site.xml

$ nano hbase-site.xml

<configuration>
	<!-- HBase集羣中所有RegionServer共享目錄,用來持久化HBase的數據,
		一般設置的是hdfs的文件目錄-->
	<property>
		<name>hbase.rootdir</name>
		<value>hdfs://master:9000/hbase</value>
	</property>
	<!-- 集羣的模式,分佈式還是單機模式,如果設置成false的話,
		HBase進程和Zookeeper進程在同一個JVM進程 -->
	<property>
		<name>hbase.cluster.distributed</name>
		<value>true</value>
	</property>
	<!--默認HMaster HTTP訪問端口-->
	<property>
		<name>hbase.master.info.port</name>
		<value>16010</value>
	</property>
	<!--默認HRegionServer HTTP訪問端口-->
	<property>
		<name>hbase.regionserver.info.port</name>
		<value>16030</value>
	</property>
	<!--指定zookeeper訪問端口-->
	<property>
		<name>hbase.zookeeper.property.clientPort</name>
		<value>2181</value>
	</property>
	<!-- zookeeper集羣的URL配置,多個host中間用逗號(,)分割 -->
	<property>
		<name>hbase.zookeeper.quorum</name>
		<value>master,weiqi1,weiqi2</value>
	</property>
	<!-- 客戶端與zk連接超時時間 -->
	<property>
		<name>zookeeper.session.timeout</name>
		<value>60000000</value>
	</property>
	<!--  -->
	<property>
		<name>dfs.support.append</name>
		<value>true</value>
	</property>
	<!-- AggregateImplementation配置,輔助實現對hbase數據的統計分析,如取最大值、最小值、平均值、數據條數等 -->
	<property>
	   <name>hbase.coprocessor.user.region.classes</name>
	   <value>org.apache.hadoop.hbase.coprocessor.AggregateImplementation</value>
	 </property>
</configuration>

5.1.4 更改 regionservers

分別把每個節點下的hostname填寫到該文件中

$ nano regionservers

weiqi1
weiqi2

5.2 部署他其他節點

$ scp -r /weiqi/hbase-2.0.0-bin weiqi1:/weiqi/hbase-2.0.0-bin
$ scp -r /weiqi/hbase-2.0.0-bin weiqi2:/weiqi/hbase-2.0.0-bin

5.3 分別配置Hbase環境變量

$ nano /etc/profile

添加:

#配置hbase環境變量
export HBASE_HOME=/weiqi/hbase-2.0.0
export PATH=$PATH:$HBASE_HOME/bin

然後重新加載配置文件使之生效:

$ source /etc/profile 

5.4 啓動Hbase集羣

進入master

#若配置了環境變量
$ start-hbase.sh
-------------------------------------
若沒有配置環境變量
進入:/weiqi/hbase-2.0.0/
$ bin/start-hbase.sh

5.4.1 hbase 啓動命令整理

啓動HBase集羣:
bin/start-hbase.sh

#**單獨啓動(有時在運行時進程會關閉,需在對應的服務器上運行)**

單獨啓動一個HMaster進程:
bin/hbase-daemon.sh start master

單獨停止一個HMaster進程:
bin/hbase-daemon.sh stop master

單獨啓動一個HRegionServer進程:
bin/hbase-daemon.sh start regionserver

單獨停止一個HRegionServer進程:
bin/hbase-daemon.sh stop regionserver

5.5 啓動成功標誌

在master上使用jps命令:

$ jps

[root@master ~]# jps
2880 HMaster					#hbase master進程
1511 SecondaryNameNode			#hadoop進程
1321 NameNode                   #hadoop master進程
1659 ResourceManager			#hadoop進程
16029 Jps
2063 QuorumPeerMain				#zookeeper進程

在weiqi1和weiqi2上使用jps命令

$ jps

[root@weiqi1 ~]# jps
9953 Jps
1234 DataNode                    #hadoop slave進程
1336 NodeManager                 #hadoop slave進程
1593 QuorumPeerMain              #zookeeper進程
1900 HRegionServer               #hbase slave進程

同時也能在瀏覽器上通過http://192.168.1.60:16010web端查看Hbase信息

這裏寫圖片描述

5.6 關閉Hbase集羣

關閉 master節點上的 hbase

[root@master ~]# stop-hbase.sh

5.7 進入hbase shell進行驗證

[root@master ~]# hbase shell
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/weiqi/hbase-2.0.0/lib/slf4j-log4j12-1.7.25.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/weiqi/hadoop-2.8.3/share/hadoop/common/lib/slf4j-log4j12-1.7.10.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory]
HBase Shell
Use "help" to get list of supported commands.
Use "exit" to quit this interactive shell.
Version 2.0.0, r7483b111e4da77adbfc8062b3b22cbe7c2cb91c1, Sun Apr 22 20:26:55 PDT 2018
Took 0.0018 seconds                                                                                                                  
hbase(main):001:0> list
TABLE                                                        
0 row(s)
Took 0.8049 seconds                                                                                                                  
=> []
hbase(main):002:0> status
1 active master, 0 backup masters, 2 servers, 0 dead, 2.0000 average load
Took 0.3276 seconds                                                                                                                  
hbase(main):003:0> 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章