Hadoop全分佈式安裝

Hadoop的全分佈式安裝
  zookeeper管理節點
  Journalnode實時備份
  FailoverControll類實現切換namenode的狀態 active standby

  需要配置的信息(3臺雲主機)
  【*練習過程中關閉防火牆，裏面用到的zookeeper沒寫配置，到博客裏面找找*】
  step1：配置主機名 /etc/hosts
    第一臺：hadoop01
    第二臺：hadoop02
    第三臺：hadoop03
    source 一下
  step2：配置免密登陸
    生成密鑰ssh-keygen
    進行復制ssh-copy-id 用戶名@主機需要複製到所有的主機
    然後重啓
    #reboot
  step3：配置Hadoop
    配置 hadoop-env.sh 配置完成需要source
    配置 core-site.xml
    配置 hdfs-site.xml
    配置 mapred-site.xml cp mapred-site.xml.template mapred-site.xml
    配置 yarn-site.xml
    編輯 slaves 添加datanode節點
    編輯環境變量 /etc/profile
  step4：具體配置
   【1】hadoop.env.sh
     JAVA_HOME=/home/preSoftware/jdk1.8
     HADOOP_CONF_DIR=/home/software/hadoop-2.7.1/etc/hadoop
     需要使配置生效 source hadoop.env.sh

【2】core-site.xml
           
           <property>
            <name>fs.defaultFS</name>
            <value>hdfs://ns</value>
           </property>
           
           <property>
            <name>hadoop.tmp.dir</name>
                  <value>/home/software/hadoop-2.7.1/tmp</value>
           </property>
           
           <property>
                  <name>ha.zookeeper.quorum</name>
           
                  <value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>
           </property>

   【3】hdfs-site.xml
     
           <property>
                  <name>dfs.nameservices</name>
                  <value>ns</value>
           </property>
     
     
     <property>
      <name>dfs.ha.namenodes.ns</name>
      <value>nn1,nn2</value>
     </property>

           
           <property>
                  <name>dfs.namenode.rpc-address.ns.nn1</name>
                  <value>hadoop01:9000</value>
           </property>
     
     <property>
      <name>dfs.namenode.http-address.ns.nn1</name>
      <value>hadoop01:50070</value>
     </property>

<property>
                  <name>dfs.namenode.rpc-address.ns.nn2</name>
                  <value>hadoop02:9000</value>
                </property>
     
     <property>
      <name>dfs.namenode.http-address.ns.nn2</name>
      <value>hadoop02:50070</value>
     </property>

<--，namenode2可以從journalnode集羣裏的指定位置上獲取信息，達到熱備效果-->
     <property>
      <name>dfs.namenode.shared.edits.dir</name>
      <value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ns</value>
     </property>

<property>
      <name>dfs.journalnode.edits.dir</name>
      <value>/home/software/hadoop-2.7.1/tmp/journal</value>
     </property>

<property>
      <name>dfs.ha.automatic-failover.enabled</name>
      <value>true</value>
     </property>
     
     <property>
            <name>dfs.client.failover.proxy.provider.ns</name>
            <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
     </property>
     
     <property>
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence</value>
     </property>
     
     <property>
      <name>dfs.ha.fencing.ssh.private-key-files</name>
      <value>/root/.ssh/id_rsa</value>
     </property>
     
           <property>
                  <name>dfs.namenode.name.dir</name>
                  <value>file:///home/software/hadoop-2.7.1/tmp/hdfs/name</value>
           </property>
     
     <property>
                  <name>dfs.datanode.data.dir</name>
                  <value>file:///home/software/hadoop-2.7.1/tmp/hdfs/data</value>
           </property>
     
     <property>
      <name>dfs.replication</name>
      <value>3</value>
     </property>
     
     <property>
      <name>dfs.permissions</name>
      <value>false</value>
     </property>
   【4】mapred-site.xml
     
     <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
     </property>
   【5】yarn-site.xml
     
           <property>
                  <name>yarn.resourcemanager.ha.enabled</name>
                  <value>true</value>
           </property>

<property>
                  <name>yarn.resourcemanager.ha.rm-ids</name>
                  <value>rm1,rm2</value>
           </property>

<property>
                  <name>yarn.resourcemanager.hostname.rm1</name>
                  <value>hadoop01</value>
           </property>

<property>
                  <name>yarn.resourcemanager.hostname.rm2</name>
                  <value>hadoop03</value>
           </property>

<property>
                  <name>yarn.resourcemanager.recovery.enabled</name>
                  <value>true</value>
           </property>

<property>
                  <name>yarn.resourcemanager.store.class</name>
                  <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
           </property>

<property>
                  <name>yarn.resourcemanager.zk-address</name>
                  <value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>
           </property>
     
           <property>
                  <name>yarn.resourcemanager.cluster-id</name>
                  <value>ns-yarn</value>
           </property>

<property>
                  <name>yarn.nodemanager.aux-services</name>
                  <value>mapreduce_shuffle</value>
           </property>

<property>
                  <name>yarn.resourcemanager.hostname</name>
            <value>hadoop03</value>
           </property>

   【6】slaves
     
     hadoop01
     hadoop02
     hadoop03
   【7】配置環境變量
     export HADOOP_HOME=/home/software/hadoop-2.7.1
     export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
   【8】創建對應的存儲文件的目錄
     tmp/{hdfs,journal}   hdfs/{data,name}
  step5：
   選擇其中一個節點進行zookeeper格式化註冊
   #hdfs zkfc -formatZK
  step6：
   分別啓動Journalnode 因爲我這裏設置hadoop01和hadoop02作爲namenode所以只需要啓動這兩個節點即可
   #hadoop-daemon.sh start journalnode
  step7：
   格式化namenode節點也就是hadoop01和hadoop02
   #hadoop namenode -format
   INFO common.Storage: Storage directory /home/software/hadoop-2.7.1/tmp/hdfs/name has been successfully formatted.
   出現successfully formatted 表示成功
  step8：
   啓動namenode節點 hadoop01和hadoop02
   #hadoop-daemon.sh start namenode
  step9：
   啓動datanode slaves文件中配置的就是datanode節點
   #hadoop-daemon.sh start datanode
  step10：
   啓動zkfc實現namenode狀態的切換 active（master）和standby（熱備）
   #hadoop-daemon.sh start zkfc
  step11：
   在hadoop01節點啓動yarn 配置mapred-site.xml 這個命令可以在任何節點運行，只需在其中一個節點運行一次
   #start-yarn.sh
  step12：
   在hadoop03節點上啓動resourcemanager     配置在yarn-site.xml
   #yarn-daemon.sh start resourcemanger
  配置完成進行訪問
  web: http://ip:50070    ip就是namenode節點的ip
  點擊overview 看到一個standby 另外一臺是active
  完成

關閉命令在namenode（active）節點 #stop-all.sh

這個命令一旦運行，所有的namenode和datanode以及Journalnode都將關閉

但是manager*沒有關閉我搜了一下關閉命令如下

關閉Resourcemanager # yarn-daemon.sh stop resourcemanager

Hadoop全分佈式安裝

lightdb hash index的性能和限制

web開發過程中的路徑問題

for循環優化

JDK1.8 stream 解讀

ObjectMapper

Hadoop全分佈式安裝

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結