上週末進行了開發區設備的搬遷,期間由於某個刀箱出現故障,其上的刀片遷移至其它刀箱,物理位置發生了變化,包括了一臺運行TSM SERVER的刀片,但是日後發現所有備份任務都失敗。
經過檢查發現,發生這些的原因在於沒有考慮到刀片發生物理位置變化後,系統識別到的drive、library的物理地址也可能發生變化,沒有進行詳細的檢查。
下面把發生的過程記錄下來,避免此類問題重現。
環境:
物理服務器:HS22
OS:windows 2008 r2
TAPE:TS3200
TSM:V6
過程:
tsm: CICDEVTSM>q path
源名稱 源類型 目的地名稱 目的地類型 聯機
----------- ----------- ----------- ---------- ------
CICDEVTSM SERVER TS3200 LIBRARY 是
CICDEVTSM SERVER TS3200DRV1 DRIVE 是
CICDEVTSM SERVER TS3200DRV2 DRIVE 是
VMAGENTSTA SERVER TS3200DRV1 DRIVE 是
VMAGENTSTA SERVER TS3200DRV2 DRIVE 是
tsm: CICDEVTSM>q libr
庫名 庫類型 ACS 專用類別 臨時類別 WORM 外部管理器 RSM 介質- 共享 不依賴 服從安裝保留
標識 臨時類別 類型 LAN
------------ ---------- ---- -------- -------- -------- -------------- ---------- ------ ------- -----------------
TS3200 SCSI 是
tsm: CICDEVTSM>q dri
庫名 驅動器名稱 設備類型 聯機
------------ ------------ ----------- -------------------
TS3200 TS3200DRV1 LTO 是
TS3200 TS3200DRV2 LTO 是
上述結果顯示正常,並且所有調度任務的狀態都是“未來”。
tsm: CICDEVTSM>q event * *
預定開始時間 實際開始時間 調度名稱 節點名 狀態
-------------------- -------------------- ------------- ------------- ---------
12/17/2014 20:00:00 WINFS_CTXDEV- WINFS_CTXDEV- 未來
FS01_SCHED01 FS01
12/17/2014 20:00:00 WINFS_CTXDEV- WINFS_CTXDEV- 未來
PVS02_SCHED- PVS02
按上述結果,認爲TSM正常了,然後處理完其它問題,大家就收工了。
2、工作日,檢查備份時,發現全部的備份任務都失敗,報錯如下:
(1)client端報:ANS1312E Server media mount not possible
(2)server端報:ANR8840E 無法打開錯誤號爲 2 且 PVRRC 爲 2839 的設備 lb0.1.0.1。
ANR8441E SCSI 庫 TS3200 的初始化失敗。
ANR1401W 卷 J04579L4 的安裝請求被拒絕 - 安裝失敗。
ANR8840E 無法打開錯誤號爲 2 且 PVRRC 爲 2839 的設備 lb0.1.0.1。
ANR8441E SCSI 庫 TS3200 的初始化失敗。
ANR1401W 卷 J04579L4 的安裝請求被拒絕 - 安裝失敗。
ANR8840E 無法打開錯誤號爲 2 且 PVRRC 爲 2839 的設備 lb0.1.0.1。
ANR8441E SCSI 庫 TS3200 的初始化失敗。
ANR1401W 卷 J04579L4 的安裝請求被拒絕 - 安裝失敗。
經過檢查,發現TSM現有path裏定義的library、drive的設備名稱都發生了變化,這應該是因爲刀片遷移位置後發生的變化。通過TSMDLST命令查看到的新名稱:
TSM Name ID LUN Bus Port SSN WWN TSM Type Driver Device Identifier
-----------------------------------------------------------------------------------------------------------------------
-----
mt5.0.0.1 5 0 0 1 1315511650 2114000E12519D46 LTO IBM IBM ULT3580-TD4
C7QH
lb5.1.0.1 5 1 0 1 00L5U78F6744_LL0 2114000E12519D46 LIBRARY IBM IBM 3573-TL
B.90
mt5.0.0.2 5 0 0 2 1315532859 2115000E15619D46 LTO IBM IBM ULT3580-TD4
C7QH
lb5.1.0.2 5 1 0 2 00L4U55F6744_LL0 2115000E15619D46 LIBRARY IBM IBM 3573-TL
B.90
接下來,就需要修改path信息了,操作如下:
先刪除:
delete path cicdevtsm ts3200drv1 srctype=server desttype=drive library=ts3200
delete path cicdevtsm ts3200drv2 srctype=server desttype=drive library=ts3200
delete path cicdevtsm ts3200 srctype=server desttype=library
再重建:
define path cicdevtsm ts3200 srctype=server desttype=library device=lb5.1.0.1
define path cicdevtsm ts3200drv1 srctype=server desttype=drive library=ts3200 device=mt5.0.0.1 autodetect=yes
define path cicdevtsm ts3200drv2 srctype=server desttype=drive library=ts3200 device=mt5.0.0.2 autodetect=yes
然後,進行手工備份,狀態正常。
ANR0406I 節點 WINFS_CTXDEVFS01(WinNT)(Tcp/Ip CTXDEVFS01(56752))的會話 20 已啓動。
ANR8439I SCSI 庫 TS3200 準備就緒進行操作。
ANR2017I 管理員 TSMADMIN 發出命令:QUERY MOUNT
ANR8379I 設備類 TS3200DEV 中的安裝點正在等待卷安裝完成,狀態:WAITING FOR VOLUME。
ANR8334I 已查找到 1 個匹配項。
ANR8337I LTO 卷 J04579L4 裝入到驅動器 TS3200DRV1 (mt5.0.0.1)。
ANR0511I 會話20打開輸出卷J04579L4。
到目前還有一個疑問:爲何在操作系統中LIBRARY、DRIVE的物理地址發生了變化,在TSM中聯機狀態還是“YES”?