hadoop2.7.3 HA高可用集羣安裝

集羣規劃

主機名	ip	安裝的軟件	進程
hadoop01	192.168.1.101	jdk、hadoop	NN、DFSZKFailoverController
hadoop02	192.168.1.102	jdk、hadoop	NN、DFSZKFailoverController
hadoop03	192.168.1.103	jdk、hadoop	RM
hadoop04	192.168.1.104	jdk、hadoop、zookeeper	DN、NM、journalnode
hadoop05	192.168.1.105	jdk、hadoop、zookeeper	DN、NM、journalnode
hadoop06	192.168.1.106	jdk、hadoop、zookeeper	DN、NM、journalnode

六臺主機

主機名：
hadoop01、hadoop02、hadoop03、hadoop04、hadoop05、hadoop06
如果不會請參考：http://blog.csdn.net/uq_jin/article/details/51355124

用戶名：Hadoop
密碼：12345678

設置主機名映射（root用戶）

將本機的主機名和IP建立映射關係

vi /etc/hosts11

加入如下文件：

192.168.2.101 hadoop01
192.168.2.102 hadoop02
192.168.2.103 hadoop03
192.168.2.104 hadoop04
192.168.2.105 hadoop05
192.168.2.106 hadoop06123456123456

拷貝/etc/hosts到其它主機

scp /etc/hosts hadoop02:/etc/scp /etc/hosts hadoop03:/etc/scp /etc/hosts hadoop04:/etc/scp /etc/hosts hadoop05:/etc/scp /etc/hosts hadoop06:/etc/1234512345

開放常用端口（root用戶）

#關閉防火牆sudo systemctl stop firewalld.service#關閉開機啓動sudo systemctl disable firewalld.service12341234

創建專有的用戶（root用戶）

一般是建專有的hadoop用戶，不在root用戶上面搭建

創建組和用戶

這裏每臺虛擬主機都應該有hadoop用戶

#先創建組cloudgroupadd cloud#創建用戶並加入組clouduseradd -g cloud hadoop#修改用戶hadoop的密碼passwd hadoop123456123456

將hadoop用戶加到sodu列表

1、查看/etc/sudoers的權限

ls -l /etc/sudoers11

可以看的是隻讀權限，如果我們要修改就必須先改變該文件的權限

2、修改權限

chmod 777 /etc/sudoers11

3、將hadoop添加root權限

vim /etc/sudoers11

在root下加入下面hadoop用戶

4、還原權限

chmod 440 /etc/sudoers11

拷貝/etc/sudoers到其它主機

scp /etc/sudoers hadoop02:/etc/scp /etc/sudoers hadoop03:/etc/scp /etc/sudoers hadoop04:/etc/scp /etc/sudoers hadoop05:/etc/scp /etc/sudoers hadoop06:/etc/1234512345

配置免密碼登錄（hadoop用戶）

切換hadoop用戶

su hadoop11

進入到當前用戶的根目錄

cd ~ 11

查看所有文件

ls –la11

進入.ssh目錄

cd .ssh11

生產公鑰和私鑰（四個回車）

ssh-keygen -t rsa11

執行完這個命令後，會生成兩個文件id_rsa（私鑰）、id_rsa.pub（公鑰）

將公鑰拷貝到要免登陸的機器上

ssh-copy-id 192.168.2.101ssh-copy-id 192.168.2.102ssh-copy-id 192.168.2.103ssh-copy-id 192.168.2.104ssh-copy-id 192.168.2.105ssh-copy-id 192.168.2.106123456123456

這時會在192.168.2.102主機的.ssh/下產生一個名爲authorized_keys的文件，這時通過 ssh 192.168.2.102時可以直接免登陸進入主機
如下：

同理可以給其他機器也設置免密碼登錄。

準備軟件

在/home/hadoop/下創建cloud文件夾，用來安裝相關軟件，同時所用安裝包放在cloud下的soft-install文件夾下，如：

cd /home/hadoopmkdir cloudmkdir soft-install123123

在soft-install裏上傳我們需要的軟件：

上傳我們所需要的軟件到這個目錄

安裝jdk

解壓

tar -zxvf jdk-8u91-linux-x64.tar.gz -C /home/hadoop/cloud/11

配置環境變量

# 修改配置文件sudo vi /etc/profile# 在最後下添加export JAVA_HOME=/home/hadoop/cloud/jdk1.8.0_91export PATH=$JAVA_HOME/bin:$PATHexport CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar# 刷新配置文件source /etc/profile1234567891012345678910

將jdk和環境變量分別拷貝到其他主機上

可以直接將cloud文件夾複製過去

scp -r cloud/ hadoop02:/home/hadoop/
scp -r cloud/ hadoop03:/home/hadoop/
scp -r cloud/ hadoop04:/home/hadoop/
scp -r cloud/ hadoop05:/home/hadoop/
scp -r cloud/ hadoop06:/home/hadoop/1234512345

將環境變量拷貝到其他主機下

sudo scp /etc/profile hadoop02:/etc/sudo scp /etc/profile hadoop03:/etc/sudo scp /etc/profile hadoop04:/etc/sudo scp /etc/profile hadoop05:/etc/sudo scp /etc/profile hadoop06:/etc/1234512345

刷新環境變量

source /etc/profile11

安裝zookeeper

如果不懂Zookeeper請參考：https://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/

下載地址：http://mirrors.hust.edu.cn/apache/zookeeper/

安裝

前面我們已經安裝的jdk，現在我們在hadoop04、hadoop05、hadoop06上安裝Zookeeper

1、解壓

tar -zxvf zookeeper-3.4.8.tar.gz -C /home/hadoop/cloud/11

2、修改Zookeeper的默認配置 conf/zoo_sample.cfg

mv zoo_sample.cfg zoo.cfgvi zoo.cfg1212

配置如下：

#修改dataDir指向我們數據dataDir=/home/hadoop/cloud/zookeeper-3.4.8/data#並在最後添加server.1=hadoop04:2888:3888server.2=hadoop05:2888:3888server.3=hadoop06:2888:3888123456123456

3、在/home/hadoop/cloud/zookeeper-3.4.8/目錄下創建data文件夾

mkdir data11

4、在data文件夾下創建myid文件指明本機id

vim myid11

id 分別對應爲hadoop04爲1，hadoop05爲2，hadoop06爲3 後面我們再統一拷貝

5、複製zookeeper-3.4.8到105、106機器上並修改相應的myid

scp -r zookeeper-3.4.8/ hadoop04:/home/hadoop/cloud/
scp -r zookeeper-3.4.8/ hadoop05:/home/hadoop/cloud/
scp -r zookeeper-3.4.8/ hadoop06:/home/hadoop/cloud/123123

啓動Zookeeper

分別在hadoop04、hadoop05、hadoop06上啓動Zookeeper

#執行/home/hadoop/cloud/zookeeper-3.4.8/bin目錄下的腳本啓動./zkServer.sh start1212

查看zookeeper的狀態

./zkServer.sh status11

在bin/目錄下運行，運行結果如下說明成功（此時至少運行2臺）

其實我們可以找到leader 然後stop，會發現Zookeeper會立即切換Leader

安裝hadoop

安裝（現在hadoop01安裝，然後複製其他機器）

解壓

tar -zxvf hadoop-2.7.2.tar.gz -C /home/hadoop/cloud/11

配置環境變量

# 修改配置文件sudo vi /etc/profile# 在最後下添加export HADOOP_HOME=/home/hadoop/cloud/hadoop-2.7.2export PATH=$PATH:$HADOOP_HOME/bin# 刷新配置文件source /etc/profile123456789123456789

測試：

which hadoop11

修改配置文件(6個)

hadoop-env.sh

# The java implementation to use.export JAVA_HOME=/home/hadoop/cloud/jdk1.8.0_911212

core-site.xml

<configuration>

    <!-- 指定hadoop運行時產生文件的存儲路徑 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/cloud/hadoop-2.7.2/tmp</value>
    </property>

    <!-- 指定hdfs的nameservice爲ns1 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://ns1</value>
    </property>

    <!-- 指定zookeeper地址，多個用,分割 -->
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>hadoop04:2181,hadoop05:2181,hadoop06:2181</value>
    </property></configuration>123456789101112131415161718192021123456789101112131415161718192021

hdfs-site.xml

<configuration>
    <!-- dfs.nameservices 命名空間的邏輯名稱，多個用,分割 -->
    <property>
      <name>dfs.nameservices</name>
      <value>ns1</value>
    </property>

    <!-- 指定ns1下有兩個namenode，分別是nn1,nn2 -->
    <property>
      <name>dfs.ha.namenodes.ns1</name>
      <value>nn1,nn2</value>
    </property>

    <!-- 指定nn1的RPC通信地址 -->
    <property>
      <name>dfs.namenode.rpc-address.ns1.nn1</name>
      <value>hadoop01:8020</value>
    </property>

    <!-- 指定nn1的HTTP通信地址 -->
    <property>
      <name>dfs.namenode.http-address.ns1.nn1</name>
      <value>hadoop01:50070</value>
    </property>

    <!-- 指定nn2的RPC通信地址 -->
    <property>
      <name>dfs.namenode.rpc-address.ns1.nn2</name>
      <value>hadoop02:8020</value>
    </property>

    <!-- 指定nn2的HTTP通信地址 -->
    <property>
      <name>dfs.namenode.http-address.ns1.nn2</name>
      <value>hadoop02:50070</value>
    </property>

    <!-- 指定namenode的元數據存放的Journal Node的地址，必須基數，至少三個 -->
    <property>
      <name>dfs.namenode.shared.edits.dir</name>
      <value>qjournal://hadoop04:8485;hadoop05:8485;hadoop06:8485/ns1</value>
    </property>

    <!--這是JournalNode進程保持邏輯狀態的路徑。這是在linux服務器文件的絕對路徑-->
    <property>
      <name>dfs.journalnode.edits.dir</name>
      <value>/home/hadoop/cloud/hadoop-2.7.2/journal/</value>
    </property>

    <!-- 開啓namenode失敗後自動切換 -->
    <property>
      <name>dfs.ha.automatic-failover.enabled</name>
      <value>true</value>
    </property>

    <!-- 配置失敗自動切換實現方式 -->
    <property>
      <name>dfs.client.failover.proxy.provider.ns1</name>
      <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>

    <!-- 配置隔離機制方法，多個機制用換行分割 -->
    <property>
      <name>dfs.ha.fencing.methods</name>
      <value>
        sshfence
        shell(/bin/true)      </value>
    </property>

    <!-- 使用sshfence隔離機制時需要ssh免登陸 -->
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/home/hadoop/.ssh/id_rsa</value>
    </property>

    <!-- 配置sshfence隔離機制超時時間30秒 -->
    <property>
       <name>dfs.ha.fencing.ssh.connect-timeout</name>
       <value>30000</value>
    </property></configuration>1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818212345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182

mapred-site.xml.template
需要重命名： mv mapred-site.xml.template mapred-site.xml

<configuration>
    <!-- 通知框架MR使用YARN -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property></configuration>1234567812345678

yarn-site.xml

<configuration>
    <!-- 指定YARN的老大（RM）的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop03</value>
    </property>

    <!-- reducer取數據的方式是mapreduce_shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property></configuration>1234567891011121312345678910111213

slaves

hadoop04
hadoop05
hadoop06123123

並在 hadoop-2.7.2文件下創建tmp文件：

mkdir tmp11

將配置好的文件拷貝到其他主機

將hadoop-2.5.2拷貝到其他主機下

scp -r hadoop-2.7.2 hadoop02:/home/hadoop/cloud/
scp -r hadoop-2.7.2 hadoop03:/home/hadoop/cloud/
scp -r hadoop-2.7.2 hadoop04:/home/hadoop/cloud/
scp -r hadoop-2.7.2 hadoop05:/home/hadoop/cloud/
scp -r hadoop-2.7.2 hadoop06:/home/hadoop/cloud/1234512345

將環境變量拷貝到其他主機下

sudo scp /etc/profile hadoop02:/etc/sudo scp /etc/profile hadoop03:/etc/sudo scp /etc/profile hadoop04:/etc/sudo scp /etc/profile hadoop05:/etc/sudo scp /etc/profile hadoop06:/etc/1234512345

刷新環境變量

source /etc/profile11

啓動

啓動的時候注意啓動順序

1、啓動zookeeper（在hadoop04、05、06 )

2、啓動journal node（在hadoop04、05、06）

#hadoop-2.7.2/sbin下./sbin/hadoop-daemon.sh start journalnode1212

3、格式化HDFS（namenode）第一次要格式化（在hadoop01、02中任意一臺）（這裏直接複製會有問題，最好手動輸入）

./bin/hdfs namenode –format11

並把/home/hadoop/cloud/hadoop-2.7.2/tmp 文件夾拷貝到另一臺namenode的目錄下

scp -r /home/hadoop/cloud/hadoop-2.7.2/tmp hadoop@hadoop02:/home/hadoop/cloud/hadoop-2.7.2/11

4、格式化 zk（在hadoop01即可）（這裏直接複雜會有問題，最好手動輸入）

./bin/hdfs zkfc –formatZK11

5、啓動zkfc來監控NN狀態（在hadoop01、02）

./sbin/hadoop-daemon.sh start zkfc11

6、啓動HDFS（namenode）（在hadoop01即可）

#hadoop-2.7.2/sbin下./sbin/start-dfs.sh1212

7、啓動YARN（MR）（在hadoop03即可）

#hadoop-2.7.2/sbin下./sbin/start-yarn.sh1212

查看結果

如果上面的啓動沒有報錯的的話，這時在我們的虛擬主機上應該分別有自己的進程，如前文我們規劃的一樣。
查看本機的Java進程

jps11

通過瀏覽器測試如下：

http://192.168.2.101:50070/11

可以看出hadoop01的namenode是處於一種standby狀態，那麼hadoop02應該是處於active狀態

查看YARN的狀態

http://192.168.2.103:8088/11

hadoop2.7.3 HA高可用集羣安裝

集羣規劃

六臺主機

設置主機名映射（root用戶）

開放常用端口（root用戶）

創建專有的用戶（root用戶）

創建組和用戶

將hadoop用戶加到sodu列表

配置免密碼登錄（hadoop用戶）

準備軟件

安裝jdk

安裝zookeeper

安裝

啓動Zookeeper

安裝hadoop

安裝（現在hadoop01安裝，然後複製其他機器）

修改配置文件(6個)

將配置好的文件拷貝到其他主機

啓動

查看結果

985 碩士程序員，空窗 4 個月沒有 Offer！

【入門教程】5分鐘教你快速學會集成Java springboot ~

營銷系統黑名單優化：位圖的應用解析

一文搞懂 Spring 循環依賴

我真的從測試轉成了開發......

盛大發布 | Zabbix 7.0 LTS--性能與擴展的卓越融合

nginx添加相應配置，通過瀏覽器訪問或curl時返回客戶端對應公網IP

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

python內置函數——sorted

[oeasy]python020在遊戲中體驗數值自由_勇闖地下城_終端文字遊戲

一份關於jvm內存調優及原理的學習筆記

JVM調優總結 -Xms -Xmx -Xmn -Xss

Jvm堆內存的劃分結構和優化，垃圾回收詳解（詳細解答篇）

Stack Overflow 2016最新架構探祕

Redis Cluster 3.0.5 集羣實戰

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結