免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4780 | 回复: 1
打印 上一主题 下一主题

[备份软件] TSM5.4备份状态检查哪里出错了? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-09-25 14:44 |只看该作者 |倒序浏览
1.        前天上午备份状态正常
2.        前天在网上看到一篇文章讲述如何使5.4也能支持web管理
按照文档:http://www.itpub.net/archiver/tid-744749.html中的提示配置后,web界面是正常了,可是在日志中总是提示:
TSM Client Error: Server: SERVER1 Source: FCCPDMAGNT Node: FCCPDMAGNT Session Id: 2 ANR0454E Session rejected by server SERVER1, reason: Communication Failure.

3.        当时以为我哪里操作有问题,就把在执行前备份的目录恢复回来:
D:\Tivoli
4.        重起服务TSM Service1  问题依旧存在;
5.        后来在提示的客户端机器上查看进程,发现有不少的tsm,dsm进程;全部kill掉(当时没有记录有哪些,大概有7到8个)
6.        最后按照/etc/inittab中的内容手动执行/usr/tivoli/tsm/StorageAgent/bin/rc.tsmstgagnt  但没有执行/usr/bin/dsmc sched 当时手动执行备份都还正常;
此时查看进程发现,只有两个:
# ps -ef|grep tsm
    root 221244  62090   0 14时35分14秒  pts/2  0:00 grep tsm
    root  86320      1   0        9月23      -  0:00 /bin/ksh /usr/tivoli/tsm/StorageAgent/bin/rc.tsmstgagnt
# ps -ef|grep dsm
    root 103308  86320   0        9月23      -  6:29 dsmsta quiet
    root 115686  62090   0 14时35分19秒  pts/2  0:00 grep dsm
7.        今天早晨发现备份数据库归档失败,另外一备份文件系统也失败;报错如下:
标号:TAPE_ERR4
标识:5537AC5F

日期/时间:     公元2009年09月24日  星期四  12时10分32秒
序号:           349
机器标识:       00CEF3034C00
节点标识:       fccpdmb
类:             H
类型:           PERM
资源名:         rmt1            
资源类:         tape
资源类型:       3580
位置:           U789D.001.DQD47AG-P1-C1-T1-W2002000E11122105-L0
VPD:            
        Manufacturer................IBM     
        Machine Type and Model......ULT3580-TD4     
        Serial Number...............1310111511
        Device Specific.(FW)........8192

描述
磁带机故障

可能原因
适配器
磁带驱动器

失败原因
适配器
磁带驱动器

        推荐的操作
        执行问题确定过程

详细数据
检测数据
0A00 0000 3400 0000 0000 0000 0000 0000 0200 0300 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

# lsdev -Cc tape                                                                                                                    
rmt0 可用 01-08-00-0,0 LVD SCSI 4mm 磁带机                                                                                                                                                                           
rmt1 可用 0A-00-02     IBM 3580 Ultrium Tape Drive (FCP)                                                                          
rmt2 可用 05-00-02     IBM 3580 Ultrium Tape Drive (FCP)                                                                           
smc0 可用 0A-00-02     IBM 3573 Tape Medium Changer (FCP)

8.        找不到原因,今天又重起了磁带库,并且执行如下命令恢复库:
  dsmserv restore db todate=09/22/2009 totime 12:00 preview=no  

9.如下命令也执行过:dsmserv -k Server1 runfile tsm1.dat

10.由于我对TSM了解的不足,目前不知道到哪找问题,或者说目前是客户端问题还是服务端问题也明确了解(客户端应该存在问题,因此进程少了很多,也不记得有哪些)
目前 还没有重起过客户端的操作系统(需要等时间)

论坛徽章:
0
2 [报告]
发表于 2009-09-25 14:46 |只看该作者

回复 #1 rain4321 的帖子

另一客户端备份归档日志的错误
input archive log thread=1 sequence=2306 recid=2002 stamp=698457607
channel t2: starting piece 1 at 25-SEP-09
RMAN-03009: failure of backup command on t1 channel at 09/25/2009 01:01:24
ORA-19502: write error on file "arch_2jkq37g9_1107_1", blockno 1 (blocksize=512)
ORA-27030: skgfwrt: sbtwrite2 returned error
ORA-19511: Error received from media manager layer, error text:
   ANS1235E (RC-72)  An unknown system error has occurred from which TSM cannot recover.
channel t1 disabled, job failed on it will be run on another channel
released channel: t1
released channel: t2
RMAN-00571: ===========================================================
RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============
RMAN-00571: ===========================================================
RMAN-03009: failure of backup command on t2 channel at 09/25/2009 01:01:24
ORA-19502: write error on file "arch_2kkq37g9_1108_1", blockno 1 (blocksize=512)
ORA-27030: skgfwrt: sbtwrite2 returned error
ORA-19511: Error received from media manager layer, error text:
   ANS1235E (RC-72)  An unknown system error has occurred from which TSM cannot recover.

Recovery Manager complete.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP