一、deb包安裝condor方法
自己去下載condor-8.2.6-287355-ubuntu_14.04_amd64.deb。我還下載了一個libmpich2-3_1.4.1-4.2_amd64.deb包,這是condor需要的一個依賴包,apt-get解決不了,就自己安裝一下。我新建了一個condor用戶,並將其加入sudoers,以下的操作都是在condor下進行的
安裝deb包
$sudo dpkg -i condor-8.2.6-287355-ubuntu_14.04_amd64.deb
這時一般會提示好多依賴包沒安裝,不着急,慢慢來解決
$sudo apt-get update
$sudo apt-get install -f
$sudo dpkg -i libmpich2-3_1.4.1-4.2_amd64.deb
$sudo apt-get install sysv-rc-conf
$sudo sysv-rc-conf condor on
$sudo service condor on
二、condor cluster配置方法
這裏我的manager是10.1.1.25,功能是隻提交任務,不執行。
slave1是10.1.1.253,功能是隻能執行任務,不能提交。slave2是10.1.1.196,功能同slave1。
數據庫是10.1.1.160,slave同storage交互操作數據庫。
1.首先,來看master的配置,配置文件是/etc/condor/condor_config,這裏我只給出成功後的截圖
要說明的是CONDOR_HOST參數,後面是manager的地址。DAEMON_LIST的問題後面解釋
2.slave的配置
好,現在解釋DAEMON_LIST,這是本機的condor進程,不一樣角色的機器的進程也不一樣
中央管理主機(可提交可執行)
DAEMON_LIST = COLLECTOR, MASTER, NEGOTIATOR, SCHEDD, STARTD
中央管理主機(只提交不執行)
DAEMON_LIST = COLLECTOR, MASTER, NEGOTIATOR, SCHEDD
作業提交主機
DAEMON_LIST = MASTER, SCHEDD
作業執行主機
DAEMON_LIST = MASTER, STARTD
DAEMON_LIST修改後用
$sudo service condor restart
重啓condor,用
$pstree | grep condor
可查看本機有哪些condor進程。在manager上能看到
在slave上可看到
用condor_submit 提交job後可在log文件中看到
可以看到該job由10.1.1.25提交,由10.1.1.196執行。說明配置的是對的。
轉載請註明出處