配置hadoop2.X的namenode HA及Yarn HA

以前用hadoop2.2.0只搭建了hadoop的高可用，但在hadoop2.2.0中始終沒有完成YARN HA的搭建，直接下載了hadoop最新穩定版本2.6.0完成了YARN HA及HADOOP HA的搭建流程，沒有仔細看hadoop的官方文檔，貌似hadoop2.2.0不支持YARN HA，如果說錯了謝謝指正呀，下面總結一下我的搭建流程：

首先完成虛擬機的搭建：

機器名	IP	安裝軟件	運行進程
namenode1	192.168.3.161	hadoop	NameNode、DFSZKFailoverController、ResourceManager
namenode2	192.168.3.162	hadoop	NameNode、DFSZKFailoverController、ResourceManager
datanode1	192.168.3.163	hadoop，zookeeper	DataNode、QuorumPeerMain、JournalNode、NodeManager
datanode2	192.168.3.164	hadoop，zookeeper	DataNode、QuorumPeerMain、JournalNode、NodeManager
datanode3	192.168.3.165	hadoop	DataNode、NodeManager
datanode4	192.168.3.166	hadoop，zookeeper	DataNode、QuorumPeerMain、JournalNode、NodeManager

說明：

在hadoop2.X中通常由兩個NameNode組成，一個處於active狀態，另一個處於standby狀態。Active NameNode對外提供服務，而Standby NameNode則不對外提供服務，僅同步active namenode的狀態，以便能夠在它失敗時快速進行切換。

hadoop2.0官方提供了兩種HDFS HA的解決方案，一種是NFS，另一種是QJM（由cloudra提出，原理類似zookeeper）。這裏我使用QJM完成。主備NameNode之間通過一組JournalNode同步元數據信息，一條數據只要成功寫入多數JournalNode即認爲寫入成功。通常配置奇數個JournalNode

虛擬機安裝linux系統，我這裏用的是centos6.4

使用root用戶修改/etc/hosts文件，如下：

192.168.3.161 namenode1
192.168.3.162 namenode2
192.168.3.163 datanode1
192.168.3.164 datanode2
192.168.3.165 datanode3
192.168.3.166 datanode4

複製代碼

安裝jdk1.7和hadoop並配置環境變量，可以配置全局的（修改/etc/profile）也可以配置當前用戶的(修改~/.bashrc文件)，這裏我配置是全局的環境變量

安裝jdk的過程直接解壓tar xzvf jdk.tar，這裏不做說明了，列出/etc/profile文件中末尾添加的內容如下：

export JAVA_HOME=/usr/java/jdk1.7.0_67
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin
export HADOOP_HOME=/home/hadoop/hadoop_installs/hadoop-2.6.0

複製代碼

使用root用戶關閉防火牆和selinux

service iptables stop

複製代碼

centos7好像把防火牆修改成firewalld，可以試試service firewalld stop

chkconfig iptables off

複製代碼

修改/etc/selinux/config文件中設置SELINUX=disabled ，然後重啓服務器

創建hadoop用戶組及hadoop用戶並完成.ssh免密碼登錄

在每臺虛擬機中通過hadoop用戶執行ssh-keygen -t rsa會在~/.ssh/目錄中生成兩個文件id_rsa和id_rsa.pub，

如果想從namenode1免密碼登錄到namenode2中要在namenode1中執行ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@namenode2

（注意：些命令中的-i一定加上否則之後的一些操作會出現ssh_exchange_identification: Connection closed by remote host這樣的錯誤），

這個命令完成後會在namenode2的~/.ssh/目錄下生成文件authorized_keys，此時可以從namenode1直接ssh到namenode2了，建議在每臺機器包括namenode2本身都執行ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@namenode2然後把生成的authorized_keys複製到集羣中每個機器上實現任何機器之間都可以免密碼登錄。

完成安裝zookeeper3.4.5集羣：主要作用是用於ZKFC（DFSZKFailoverController）故障轉移，當Active NameNode掛掉了，會自動切換Standby NameNode爲standby狀態

解壓zookeeper包在zookeeper3.4.5/conf/目錄執行mv zoo_sample.cfg zoo.cfg，之後修改zoo.cfg文件，如下：

修改dataDir=/hadoop/zookeeper-3.4.5/tmp（zookeeper修改源數據的地方，包括myid文件）

文件最後添加

server.1=datanode1:2888:3888
server.2=datanode2:2888:3888
server.3=datanode4:2888:3888

複製代碼

保存退出
然後分別在datanode1,2,4節點中創建一個tmp文件夾，mkdir /hadoop/zookeeper-3.4.5/tmp ，再創建一個空文件 touch /hadoop/zookeeper-3.4.5/tmp/myid 最後向該文件寫入ID，datanode1執行echo 1 > /hadoop/zookeeper-3.4.5/tmp/myid，datanode1執行echo 2 > /hadoop/zookeeper-3.4.5/tmp/myid，datanode3執行echo 3 > /hadoop/zookeeper-3.4.5/tmp/myid

安裝配置hadoop2.6.0集羣：

解壓文件後配置HDFS（注意：hadoop2.X之後所有的配置文件都在$HADOOP_HOME/etc/hadoop目錄下），需要修改文件如下：

修改文件hadoo-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_67
export HADOOP_LOG_DIR=/data/log/hadoop

複製代碼

指定日誌存放目錄

修改文件core-site.xml

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://gagcluster</value>
</property>
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/data/hadoop/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>hadoop.proxyuser.hduser.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.hduser.groups</name>
<value>*</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>dataNode1:2181,dataNode2:2181,dataNode4:2181</value>
</property>
</configuration>

複製代碼

修改文件hdfs-site.xml

<configuration>
<property>
<name>dfs.nameservices</name>
<value>gagcluster</value>
</property>
<property>
<name>dfs.ha.namenodes.gagcluster</name>
<value>nn1,nn2</value>
</property>
<property>
<name>dfs.namenode.rpc-address.gagcluster.nn1</name>
<value>namenode1:9000</value>
</property>
<property>
<name>dfs.namenode.rpc-address.gagcluster.nn2</name>
<value>namenode2:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.gagcluster.nn1</name>
<value>namenode1:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.gagcluster.nn2</name>
<value>namenode2:50070</value>
</property>
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://dataNode1:8485;datanode2:8485;datanode4:8485/gagcluster</value>
</property>
<property>
<name>dfs.client.failover.proxy.provider.gagcluster</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/home/hadoop/.ssh/id_rsa</value>
</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/data/hadoop/tmp/journal</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/data/hadoop/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/data/hadoop/dfs/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.journalnode.http-address</name>
<value>0.0.0.0:8480</value>
</property>
<property>
<name>dfs.journalnode.rpc-address</name>
<value>0.0.0.0:8485</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>dataNode1:2181,dataNode2:2181,dataNode4:2181</value>
</property>
</configuration>

複製代碼

修改文件yarn-site.xml

<configuration>
<property>
<name>yarn.resourcemanager.connect.retry-interval.ms</name>
<value>2000</value>
</property>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>dataNode1:2181,dataNode2:2181,dataNode4:2181</value>
</property>
<property>
<name>yarn.resourcemanager.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>namenode1</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>namenode2</value>
</property>
<property>
<name>yarn.resourcemanager.ha.id</name>
<value>rm1</value>
<description>If we want to launch more than one RM in single node, we need this configuration</description>
</property>
<property>
<name>yarn.resourcemanager.recovery.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.zk-state-store.address</name>
<value>datanode1:2181,datanode2:2181,datanode4:2181</value>
</property>
<property>
<name>yarn.resourcemanager.store.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>datanode1:2181,datanode2:2181,datanode4:2181</value>
</property>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>gagcluster-yarn</value>
</property>
<property>
<name>yarn.app.mapreduce.am.scheduler.connection.wait.interval-ms</name>
<value>5000</value>
</property>
<property>
<name>yarn.resourcemanager.address.rm1</name>
<value>namenode1:8132</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address.rm1</name>
<value>namenode1:8130</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address.rm1</name>
<value>namenode1:8188</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address.rm1</name>
<value>namenode1:8131</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address.rm1</name>
<value>namenode1:8033</value>
</property>
<property>
<name>yarn.resourcemanager.ha.admin.address.rm1</name>
<value>namenode1:23142</value>
</property>
<property>
<name>yarn.resourcemanager.address.rm2</name>
<value>namenode2:8132</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address.rm2</name>
<value>namenode2:8130</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address.rm2</name>
<value>namenode2:8188</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address.rm2</name>
<value>namenode2:8131</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address.rm2</name>
<value>namenode2:8033</value>
</property>
<property>
<name>yarn.resourcemanager.ha.admin.address.rm2</name>
<value>namenode2:23142</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>/data/hadoop/yarn/local</value>
</property>
<property>
<name>yarn.nodemanager.log-dirs</name>
<value>/data/log/hadoop</value>
</property>
<property>
<name>mapreduce.shuffle.port</name>
<value>23080</value>
</property>
<property>
<name>yarn.client.failover-proxy-provider</name>
<value>org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider</value>
</property>
<property>
<name>yarn.resourcemanager.ha.automatic-failover.zk-base-path</name>
<value>/yarn-leader-election</value>
<description>Optional setting. The default value is /yarn-leader-election</description>
</property>
</configuration>

複製代碼

修改文件mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>0.0.0.0:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>0.0.0.0:19888</value>
</property>
</configuration>

複製代碼

修改文件slaves

atanode1
datanode2
datanode3
datanode4

複製代碼

修改文件yarn-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_67
export YARN_LOG_DIR=/data/log/hadoop指定日誌存放目錄

複製代碼

把配置好的文件遠程scp到集羣其它節點相應目錄中，注意修改YARN高可用的yarn-site.xml文件中的yarn.resourcemanager.ha.id項

啓動zookeeper集羣（分別在datanode1、datanode2、datanode4上啓動zk）
進入到 zookeeper-3.4.5/bin/

./zkServer.sh start

複製代碼

查看狀態：

./zkServer.sh status

複製代碼

（一個leader，兩個follower）

啓動journalnode（在namenode1上啓動所有journalnode）
進入到hadoop-2.6.0

sbin/hadoop-daemons.sh start journalnode

複製代碼

　　　　或者單獨進入到datanode1,datanode2,datanode4執行

　　　　sbin/hadoop-daemon.sh start journalnode

複製代碼

(運行jps命令檢驗，多了JournalNode進程)

格式化HDFS
在namenode1上執行命令:

hadoop namenode -format

複製代碼

格式化後會在根據core-site.xml中的hadoop.tmp.dir配置生成個文件，之後通過sbin/hadoop-daemon.sh start namenode啓動namenode進程在namenode2上執行hdfs namenode -bootstrapStandby完成主備節點同步信息

格式化ZK(在namenode1上執行即可)

hdfs zkfc -formatZK

複製代碼

啓動HDFS(在namenode1上執行)

sbin/start-dfs.sh

複製代碼

啓動YARN(在namenode1和namenode2上執行)

sbin/start-yarn.sh

複製代碼

　　　　注意在namenode2上執行此命令時會提示NodeManager已存在等信息不用管這些，主要是啓動namenode2上的resourceManager完成與namenode1的互備作用，目前沒有找到單獨啓動resourceManager的方法

啓動完成之後可以在瀏覽器中輸入http://192.168.3.161:50070和http://192.168.3.162:50070查看namenode分別爲Active和Standby

在namenode1上執行${HADOOP_HOME}/bin/yarn rmadmin -getServiceState rm1查看rm1和rm2分別爲active和standby狀態，也可以通過瀏覽器訪問http://192.168.3.161:8188查看狀態

配置hadoop2.X的namenode HA及Yarn HA

如何使用 JS 判斷用戶是否處於活躍狀態

Mono 支持LoongArch架構

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

文本檢索模式的學習過程與應用

hive的數據操作的相關語法知識

Java實現的網絡爬蟲

hive的視圖與索引的相關語法知識

Windows遠程連接Linux圖形界面

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結