文章目錄
軟件版本
操作系統:centos 7.5 64位
CDH:5.15.2,對應的大數據組件版本
jdk:1.7
Cloudera Manger 架構
安裝包 | 下載地址 |
---|---|
parcel:所有大數據組件,以二進制方式打包在一個文件中 | http://archive.cloudera.com/cdh5/parcels/ *注意下載的版本必須與操作系統版本一致,否則在安裝的時候會重新下載對應的版本 |
jdk:oracle 64位 jdk | http://archive.cloudera.com/cm5/redhat/7/x86_64/cm/5.15.2/RPMS/x86_64/ |
Clouder Manager相關文件 | http://archive.cloudera.com/cm5/redhat/7/x86_64/cm/5.15.2/RPMS/x86_64/ |
centos鏡像 | http://vault.centos.org/7.5.1804/isos/x86_64/ |
虛擬機設置
以下步驟如未特別說明,均需在所有節點操作
Step1:安裝虛擬機(阿里雲忽略此步驟)
利用vmvare或者virtualbox(百度即可有安裝步驟)
(自己的機器)建議:安裝好一臺後通過導入導出功能複製其他兩臺
Step2:設置網絡(針對自己搭建的虛擬機)
設置網絡(自己的虛擬機需設置爲橋接)
Step3:設置hosts(後續操作均以root用戶執行)
這裏用的是阿里雲內網ip
vi /etc/hosts:
172.26.234.49 slave1
172.26.234.50 slave2
172.26.234.51 master
Step4:關閉SELinux及防火牆(阿里雲機器忽略此步驟)
-
關閉SELinux:
vi /etc/selinux/config ,修改如下:
SELINUX=disabled -
關閉防火牆:
啓動: systemctl start firewalld
查看狀態: systemctl status firewalld
停止: systemctl stop firewalld
禁用: systemctl disable firewalld
systemctl stop iptables.service
systemctl status iptables.service
systemctl disable iptables.service
Step5: 設置ssh免密登錄
- 生成密鑰:
ssh-keygen -t rsa(默認位於 ~/.ssh/) - 拷貝公鑰到所有機器:
ssh-copy-id root@master
ssh-copy-id root@slave1
ssh-copy-id root@slave2 - 測試免密登錄:
ssh master
ssh slave1
ssh slave2
Step6: 設置ntp時間同步服務(阿里雲無需同步)
-
安裝 ntp
yum –y install ntp -
設置NTP服務開機啓動
chkconfig ntpd on
將master設置爲主服務器(在master節點操作):
1. vi /etc/ntp.conf,內容如下:
driftfile /var/lib/ntp/ntp.drift #草稿文件
# 允許內網其他機器同步時間
restrict *自己的內網段* mask 255.255.255.0 nomodify notrap
# Use public servers from the pool.ntp.org project.
# 中國這邊最活躍的時間服務器 : [http://www.pool.ntp.org/zone/cn](http://www.pool.ntp.org/zone/cn)
server 210.72.145.44 perfer # 中國國家受時中心
server 202.112.10.36 # 1.cn.pool.ntp.org
server 59.124.196.83 # 0.asia.pool.ntp.org
# allow update time by the upper server
# 允許上層時間服務器主動修改本機時間
restrict 210.72.145.44 nomodify notrap noquery
restrict 202.112.10.36 nomodify notrap noquery
restrict 59.124.196.83 nomodify notrap noquery
# 外部時間服務器不可用時,以本地時間作爲時間服務
server 127.127.1.0 # local clock
fudge 127.127.1.0 stratum 10
2. 重啓服務: service ntpd restart
3. 查看同步狀態: netstat -tlunp | grep ntp
設置slave到master 的同步(在slave節點操作):
1. vi /etc/ntp.conf,內容如下:
driftfile /var/lib/ntp/ntp.drift # 草稿文件
statsdir /var/log/ntpstats/
statistics loopstats peerstats clockstats
filegen loopstats file loopstats type day enable
filegen peerstats file peerstats type day enable
filegen clockstats file clockstats type day enable
# 讓NTP Server爲內網的ntp服務器
server *自己的master ip*
fudge *自己的master ip* stratum 5
# 不允許來自公網上ipv4和ipv6客戶端的訪問
restrict -4 default kod notrap nomodify nopeer noquery
restrict -6 default kod notrap nomodify nopeer noquery
# Local users may interrogate the ntp server more closely.
restrict 127.0.0.1
restrict ::1
2. 重啓服務: service ntpd restart
3. 手動同步: ntpdate -u 192.168.137.110
Step7: 上傳安裝文件
cdh文件夾裏有
cm文件夾裏有
cm文件夾可以放在任意文件夾
cdh下的內容放在/opt/cloudera/parcel-repo文件夾中
cloudera-manager-installer.bin可以放在任意處
cloudera-manager.repo放在/etc/yun.repos.d文件夾下
Step8: 安裝jdk&CM(cm文件夾下)
- 驗證repo文件是否起效
yum list | grep cloudera
#如果列出的不是待安裝的版本,執行下面命令重試
yum clean all
yum list | grep cloudera
- 切換到cm目錄下,執行
yum -y install *.rpm
安裝完畢檢查
rpm -qa | grep cloudera
- 設置java路徑:
vi /etc/profile
# 在該文件末尾添加以下行
JAVA_HOME=/usr/java/jdk1.7.0_67-cloudera
PATH=$JAVA_HOME/bin:$PATH
export JAVA_HOME PATH - 檢查安裝:
source /etc/profile
java -version
Step9: 安裝CDH(只在master節點)
-
進入cloudera-manager-installer.bin文件目錄,給bin文件賦予可執行權限:
chmod +x ./cloudera-manager-installer.bin -
運行:
第一次運行這個cloudera-manager-installer.bin的時候先刪除/etc/cloudera-scm-server/db.properties文件。
然後運行:
./cloudera-manager-installer.bin
然後下一步下一步即可。
啓動過程較爲漫長;等待上圖結束後;可以查看日誌/var/log/cloudera-scm-server來觀察啓動狀態
以上爲止給每個虛機創建一個快照防止出現安裝失敗重新開始
啓動完畢;登錄默認賬號admin 密碼admin
先更改密碼然後接受許可繼續
選擇免費版繼續
組件介紹;點擊繼續
指定主機;繼續
選擇存儲庫
jdk已經安裝過;不必勾選
不必選擇單用戶
和root密碼相同
安裝中
分配檢查
上圖如果出現主機狀況運行不良
解決方法如下
是因爲節點上次安裝沒有成功,需要刪除cm_guid文件才能再次安裝。
[root@master ~]# find / -name cm_guid
/var/lib/cloudera-scm-agent/cm_guid
[root@master ~]# rm -rf /var/lib/cloudera-scm-agent/cm_guid --刪除文件
[root@master ~]# /etc/init.d/cloudera-scm-agent restart --重啓服務
搭建完畢
自己選擇自己需要的組件
Step10: HDFS設置(如無包紅可以忽略)
-
在CM console中將副本設爲2:dfs.replication=2
-
命令行執行:hadoop fs -setrep 2 /
CDH啓動與關閉
- CM Portal 地址:
http://master:7180/cmf/home - 關閉步驟:
- 在CM portal上關閉 cluster
- 在所有節點關閉CM agent: service cloudera-scm-agent stop
- 在master節點關閉CM server: service cloudera-scm-server stop
- 啓動步驟:
- 在所有節點啓動CM agent: service cloudera-scm-agent start
- 在master節點啓動CM server: service cloudera-scm-server start
- 在CM portal上啓動 cluster
- 查看啓動日誌:
- /var/log/cloudera-scm-server/cloudera-scm-server.log