rain4321 发表于 2009-09-25 14:44

TSM5.4备份状态检查哪里出错了?

1.        前天上午备份状态正常
2.        前天在网上看到一篇文章讲述如何使5.4也能支持web管理
按照文档:http://www.itpub.net/archiver/tid-744749.html中的提示配置后,web界面是正常了,可是在日志中总是提示:
TSM Client Error: Server: SERVER1 Source: FCCPDMAGNT Node: FCCPDMAGNT Session Id: 2 ANR0454E Session rejected by server SERVER1, reason: Communication Failure.

3.        当时以为我哪里操作有问题,就把在执行前备份的目录恢复回来:
D:\Tivoli
4.        重起服务TSM Service1问题依旧存在;
5.        后来在提示的客户端机器上查看进程,发现有不少的tsm,dsm进程;全部kill掉(当时没有记录有哪些,大概有7到8个)
6.        最后按照/etc/inittab中的内容手动执行/usr/tivoli/tsm/StorageAgent/bin/rc.tsmstgagnt但没有执行/usr/bin/dsmc sched 当时手动执行备份都还正常;
此时查看进程发现,只有两个:
# ps -ef|grep tsm
    root 22124462090   0 14时35分14秒pts/20:00 grep tsm
    root86320      1   0      9月23      -0:00 /bin/ksh /usr/tivoli/tsm/StorageAgent/bin/rc.tsmstgagnt
# ps -ef|grep dsm
    root 10330886320   0      9月23      -6:29 dsmsta quiet
    root 11568662090   0 14时35分19秒pts/20:00 grep dsm
7.        今天早晨发现备份数据库归档失败,另外一备份文件系统也失败;报错如下:
标号:TAPE_ERR4
标识:5537AC5F

日期/时间:   公元2009年09月24日星期四12时10分32秒
序号:         349
机器标识:       00CEF3034C00
节点标识:       fccpdmb
类:             H
类型:         PERM
资源名:         rmt1            
资源类:         tape
资源类型:       3580
位置:         U789D.001.DQD47AG-P1-C1-T1-W2002000E11122105-L0
VPD:            
      Manufacturer................IBM   
      Machine Type and Model......ULT3580-TD4   
      Serial Number...............1310111511
      Device Specific.(FW)........8192

描述
磁带机故障

可能原因
适配器
磁带驱动器

失败原因
适配器
磁带驱动器

      推荐的操作
      执行问题确定过程

详细数据
检测数据
0A00 0000 3400 0000 0000 0000 0000 0000 0200 0300 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

# lsdev -Cc tape                                                                                                                  
rmt0 可用 01-08-00-0,0 LVD SCSI 4mm 磁带机                                                                                                                                                                           
rmt1 可用 0A-00-02   IBM 3580 Ultrium Tape Drive (FCP)                                                                        
rmt2 可用 05-00-02   IBM 3580 Ultrium Tape Drive (FCP)                                                                           
smc0 可用 0A-00-02   IBM 3573 Tape Medium Changer (FCP)

8.        找不到原因,今天又重起了磁带库,并且执行如下命令恢复库:
dsmserv restore db todate=09/22/2009 totime 12:00 preview=no

9.如下命令也执行过:dsmserv -k Server1 runfile tsm1.dat

10.由于我对TSM了解的不足,目前不知道到哪找问题,或者说目前是客户端问题还是服务端问题也明确了解(客户端应该存在问题,因此进程少了很多,也不记得有哪些)
目前 还没有重起过客户端的操作系统(需要等时间)

rain4321 发表于 2009-09-25 14:46

回复 #1 rain4321 的帖子

另一客户端备份归档日志的错误
input archive log thread=1 sequence=2306 recid=2002 stamp=698457607
channel t2: starting piece 1 at 25-SEP-09
RMAN-03009: failure of backup command on t1 channel at 09/25/2009 01:01:24
ORA-19502: write error on file "arch_2jkq37g9_1107_1", blockno 1 (blocksize=512)
ORA-27030: skgfwrt: sbtwrite2 returned error
ORA-19511: Error received from media manager layer, error text:
   ANS1235E (RC-72)An unknown system error has occurred from which TSM cannot recover.
channel t1 disabled, job failed on it will be run on another channel
released channel: t1
released channel: t2
RMAN-00571: ===========================================================
RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============
RMAN-00571: ===========================================================
RMAN-03009: failure of backup command on t2 channel at 09/25/2009 01:01:24
ORA-19502: write error on file "arch_2kkq37g9_1108_1", blockno 1 (blocksize=512)
ORA-27030: skgfwrt: sbtwrite2 returned error
ORA-19511: Error received from media manager layer, error text:
   ANS1235E (RC-72)An unknown system error has occurred from which TSM cannot recover.

Recovery Manager complete.
页: [1]
查看完整版本: TSM5.4备份状态检查哪里出错了?