處理Inactive OSTS
掛載一個客戶端或者MDT帶有一個或者多個Inactive OST,執行類似下面的命令:
client# mount -o exclude=testfs-OST0000 -t lustre uml1:/testfs /mnt/testfs
client# lctl get_param lov.testfs-clilov-*.target_obd
激活正在完好運行的客戶端或者MDT上的Inactive OST,使用 lctl activate 命令在OSC設備上。eg:
lctl --device 7 activate
Note:
也可以指定一個冒號分割的列表;eg: exclude=testfsOST0000:testfs-OST0001
找到Lustre文件系統中的所有節點
在MDS上執行下面這條命令,能夠得到所有Lustre節點的列表:
# lctl get_param mgs.MGS.live.*
Note:
這個命令必須在MGS上運行。
本例中,文件系統 testfs 有三個節點,testfs-MDT0000 , testfs-OST0000 , 和
testfs-OST0001 。
mgs:/root# lctl get_param mgs.MGS.live.*
fsname: testfs
flags: 0x0 gen: 26
testfs-MDT0000
testfs-OST0000
testfs-OST0001
得到所有OST的名字,在MDS執行以下命令:
mds:/root# lctl get_param lov.*-mdtlov.target_obd
Note:
這個命令必須在MGS上運行。
本例中,有兩個OST, testfs-OST0000 和 testfs-OST0001 ,都是活動狀態:
mgs:/root# lctl get_param lov.testfs-mdtlov.target_obd
0: testfs-OST0000_UUID ACTIVE
1: testfs-OST0001_UUID ACTIVE
網絡檢測(Lnet)
# lctl list_nids
12.0.6.131@tcp1
# lctl ping 語法
# lctl ping <nids>
# lctl ping 12.0.6.131@tcp1
12345-0@lo
12345-12.0.6.131@tcp1
# 直接ping12.0.6.131是不對的,應爲默認的是tcp不是nids輸出tcp1
# lctl ping 12.0.6.131
failed to ping 12.0.6.131@tcp: Input/output error
P114