一次TSM SERVER服務器物理位置遷移引發的備份失敗

        上週末進行了開發區設備的搬遷,期間由於某個刀箱出現故障,其上的刀片遷移至其它刀箱,物理位置發生了變化,包括了一臺運行TSM SERVER的刀片,但是日後發現所有備份任務都失敗。


        經過檢查發現,發生這些的原因在於沒有考慮到刀片發生物理位置變化後,系統識別到的drive、library的物理地址也可能發生變化,沒有進行詳細的檢查。


        下面把發生的過程記錄下來,避免此類問題重現。

        環境:

               物理服務器:HS22

               OS:windows 2008 r2

               TAPE:TS3200

               TSM:V6

        

        過程:


       1、 TSM SERVER刀片物理位置變化後,開機,並啓動TSM Server服務,進行例行的檢查:

tsm: CICDEVTSM>q path
 
源名稱          源類型          目的地名稱      目的地類型     聯機
-----------     -----------     -----------     ----------     ------
CICDEVTSM       SERVER          TS3200          LIBRARY        是
CICDEVTSM       SERVER          TS3200DRV1      DRIVE          是
CICDEVTSM       SERVER          TS3200DRV2      DRIVE          是
VMAGENTSTA      SERVER          TS3200DRV1      DRIVE          是
VMAGENTSTA      SERVER          TS3200DRV2      DRIVE          是


tsm: CICDEVTSM>q libr
 
庫名           庫類型       ACS    專用類別   臨時類別   WORM       外部管理器       RSM 介質-    共享     不依賴    服從安裝保留
                            標識                         臨時類別                    類型                  LAN
------------   ----------   ----   --------   --------   --------   --------------   ----------   ------   -------   -----------------
TS3200         SCSI                                                                               是

tsm: CICDEVTSM>q dri
 
庫名             驅動器名稱       設備類型        聯機
------------     ------------     -----------     -------------------
TS3200           TS3200DRV1       LTO             是
TS3200           TS3200DRV2       LTO             是


        上述結果顯示正常,並且所有調度任務的狀態都是“未來”。

tsm: CICDEVTSM>q event * *


預定開始時間             實際開始時間             調度名稱          節點名            狀態
--------------------     --------------------     -------------     -------------     ---------
12/17/2014 20:00:00                               WINFS_CTXDEV-     WINFS_CTXDEV-     未來
                                                   FS01_SCHED01      FS01
12/17/2014 20:00:00                               WINFS_CTXDEV-     WINFS_CTXDEV-     未來
                                                   PVS02_SCHED-      PVS02

        按上述結果,認爲TSM正常了,然後處理完其它問題,大家就收工了。


        2、工作日,檢查備份時,發現全部的備份任務都失敗,報錯如下:

(1)client端報:ANS1312E Server media mount not possible
(2)server端報:ANR8840E 無法打開錯誤號爲 2 且 PVRRC 爲 2839 的設備 lb0.1.0.1。
               ANR8441E SCSI 庫 TS3200 的初始化失敗。
               ANR1401W 卷 J04579L4 的安裝請求被拒絕 - 安裝失敗。
               ANR8840E 無法打開錯誤號爲 2 且 PVRRC 爲 2839 的設備 lb0.1.0.1。
               ANR8441E SCSI 庫 TS3200 的初始化失敗。
               ANR1401W 卷 J04579L4 的安裝請求被拒絕 - 安裝失敗。
               ANR8840E 無法打開錯誤號爲 2 且 PVRRC 爲 2839 的設備 lb0.1.0.1。
               ANR8441E SCSI 庫 TS3200 的初始化失敗。
               ANR1401W 卷 J04579L4 的安裝請求被拒絕 - 安裝失敗。

         經過檢查,發現TSM現有path裏定義的library、drive的設備名稱都發生了變化,這應該是因爲刀片遷移位置後發生的變化。通過TSMDLST命令查看到的新名稱:

TSM Name     ID   LUN  Bus  Port SSN                     WWN               TSM Type     Driver   Device Identifier
 
-----------------------------------------------------------------------------------------------------------------------
-----
mt5.0.0.1    5    0    0    1    1315511650              2114000E12519D46  LTO          IBM      IBM     ULT3580-TD4
 C7QH
lb5.1.0.1    5    1    0    1    00L5U78F6744_LL0        2114000E12519D46  LIBRARY      IBM      IBM     3573-TL
 B.90
mt5.0.0.2    5    0    0    2    1315532859              2115000E15619D46  LTO          IBM      IBM     ULT3580-TD4
 C7QH
lb5.1.0.2    5    1    0    2    00L4U55F6744_LL0        2115000E15619D46  LIBRARY      IBM      IBM     3573-TL
 B.90



        接下來,就需要修改path信息了,操作如下:

        先刪除: 
delete path cicdevtsm ts3200drv1 srctype=server desttype=drive library=ts3200
delete path cicdevtsm ts3200drv2 srctype=server desttype=drive library=ts3200
delete path cicdevtsm ts3200 srctype=server desttype=library


        再重建:
define path cicdevtsm ts3200 srctype=server desttype=library device=lb5.1.0.1
define path cicdevtsm ts3200drv1 srctype=server desttype=drive library=ts3200 device=mt5.0.0.1 autodetect=yes
define path cicdevtsm ts3200drv2 srctype=server desttype=drive library=ts3200 device=mt5.0.0.2 autodetect=yes

        然後,進行手工備份,狀態正常。

ANR0406I 節點 WINFS_CTXDEVFS01(WinNT)(Tcp/Ip CTXDEVFS01(56752))的會話 20 已啓動。
ANR8439I SCSI 庫 TS3200 準備就緒進行操作。
ANR2017I 管理員 TSMADMIN 發出命令:QUERY MOUNT
ANR8379I 設備類 TS3200DEV 中的安裝點正在等待卷安裝完成,狀態:WAITING FOR VOLUME。
ANR8334I         已查找到 1 個匹配項。
ANR8337I LTO 卷 J04579L4 裝入到驅動器 TS3200DRV1 (mt5.0.0.1)。
ANR0511I 會話20打開輸出卷J04579L4。

        到目前還有一個疑問:爲何在操作系統中LIBRARY、DRIVE的物理地址發生了變化,在TSM中聯機狀態還是“YES”?


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章