Lustre 維護

處理Inactive OSTS

掛載一個客戶端或者MDT帶有一個或者多個Inactive OST,執行類似下面的命令:

client# mount -o exclude=testfs-OST0000 -t lustre uml1:/testfs /mnt/testfs

client# lctl get_param lov.testfs-clilov-*.target_obd

激活正在完好運行的客戶端或者MDT上的Inactive OST,使用 lctl activate 命令在OSC設備上。eg:

lctl --device 7 activate

Note:

也可以指定一個冒號分割的列表;eg: exclude=testfsOST0000:testfs-OST0001

找到Lustre文件系統中的所有節點

在MDS上執行下面這條命令,能夠得到所有Lustre節點的列表:

# lctl get_param mgs.MGS.live.*

Note:

這個命令必須在MGS上運行。

本例中,文件系統 testfs 有三個節點,testfs-MDT0000 , testfs-OST0000 , 和
testfs-OST0001

mgs:/root# lctl get_param mgs.MGS.live.*
fsname: testfs
flags: 0x0 gen: 26
testfs-MDT0000
testfs-OST0000
testfs-OST0001

得到所有OST的名字,在MDS執行以下命令:

mds:/root# lctl get_param lov.*-mdtlov.target_obd

Note:

這個命令必須在MGS上運行。

本例中,有兩個OST, testfs-OST0000testfs-OST0001 ,都是活動狀態:

mgs:/root# lctl get_param lov.testfs-mdtlov.target_obd
0: testfs-OST0000_UUID ACTIVE
1: testfs-OST0001_UUID ACTIVE

網絡檢測(Lnet)

# lctl list_nids
12.0.6.131@tcp1

# lctl ping 語法
# lctl ping <nids>

# lctl ping 12.0.6.131@tcp1
12345-0@lo
12345-12.0.6.131@tcp1

# 直接ping12.0.6.131是不對的,應爲默認的是tcp不是nids輸出tcp1
# lctl ping 12.0.6.131
failed to ping 12.0.6.131@tcp: Input/output error

P114

發佈了55 篇原創文章 · 獲贊 20 · 訪問量 16萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章