免费注册 查看新帖 |

ChinaUnix.net

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5343 | 回复: 7

[VTL与磁带系统] SUN L8带库故障解决案例(笔记) [复制链接]

论坛徽章:
4
IT运维版块每日发帖之星
日期:2015-08-19 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-28 06:20:00IT运维版块每周发帖之星
日期:2015-09-11 19:20:31
发表于 2008-12-11 15:49 |显示全部楼层
日前,解决了一个SUN L8的小故障。因为平时很少用带库,故记下来,权作笔记,也欢迎网友参考指正。

一、环境:
sun 480v双机
sun 3510阵列
sun L8带库

solaris 9 + SVM + sun cluster
oracle 9i
NBU 5.0 GA

备份模式:
数据库每日一次全备,4次归档备份

NBU配置模式:
L8 scsi连接host2
host2做NBU的master server和media server, host1为NBU的client
当前业务跑在host1上,rman备份数据,由NBU控制,经局网传到连接host2的L8上。
L8中放了8盘磁带,7盘数据库,1盘清洗带,8盘带全属于一个卷组。7盘数据带分两部分应用,6盘用于oracle卷池,1盘用于备用卷

池(暂无实际应用)。



二、故障现象:

L8的4个LED灯,自左数3个灯都常亮,包括清洗灯(clean),介质故障灯(media attention)。第4个灯,严重故障灯(error)未亮


L8面板LCD显示,slot 7介质有问题,提示"!"。


三、分析:
可能是驱动器需要清洗了。
可能是slot 7上的磁带有问题(已经买了几年的旧带,最近一两个月才真正启用)
可能是其它更严重的故障
……

四、预定解决方案:

前提:
1. 客户没有可用于更换的新的数据带
2. 客户有新的清洗带,但带到现场的是没有标签(条码)的(标签早丢了)

步骤:
1. 清洗驱动器。先NBU内控制清洗;不行的话,再用L8面板控制清洗;再不行的话,更换无标签的清洗带,尝试识别(robot

ivnentory),再并清洗
2. 在NBU中删除损坏的磁带,卸载故障磁带
3. 重启L8,自检测试,再试用。如还有问题,向厂家硬件报障并更换。


五、实际操作步骤:

1. 检查NBU备份状态
每日备份状态一切正常。

因为是才启用的磁带备份,数据库又很小,全库备份才600MB,磁带容量200G/盘(压缩后400G),目前实际只用了slot 5上的磁带

,即所有数据都在slot 5的带上。故障的slot 7上的磁带属于oracle卷池中的一盘数据带,当前未含有有效数据。

2. 检查NBU报告和介质状态
只发现了一次明显介质相关错误(I/O读写失败),与slot 7磁带有关。
驱动器上的mount记录,绝大部分集中在slot 5的带上(实际备份只用到它了,同池其它带还没来得及循环使用),其它带子基本没

有被mount过,或只有2-3次左右的mount,目前总共已备份数据超过33G。

3. 暂停所有备份策略
将所有atcive备份的策略deactive

3. 在NBU中清洗驱动器
第一次清洗操作不能启动。
检查发现当前剩余清洗次数已为0,手工调整到10,再尝试清洗后,清洗灯熄灭,介质故障灯仍然常亮。
(注:这种清洗带理论上支持50次清洗,现在剩余次数为0,也不知是已清洗过50次(或原指定次数),还是原来的设置有问题,未

详查)

4. 重复清洗
根据L8的手册提示,介质故障灯如果常亮,也可能是清洗的次数不够,建议重复清洗3次以上,重复清洗了3次,此灯仍亮,判定介

质有问题。
(注:之前未启用备份时,原带就曾更换过几盘,这些数据带都年头过久,不太可靠)

5. 删除并卸载故障磁带
在NBU oracle卷池中删除了故障带。

停止了NBU介质管理器后台进程。(注:相关专家提示没有这个必要,但我为了保险,还是停掉了,因为我不清楚NBU对L8的控制程

度如何,下一步操作是要操作L8硬件,担心给NBU介质管理器造成混乱)

面板操作L8,取出了故障带,介质故障灯随之熄灭。

6. 重启NBU介质管理器后台进程,检查NBU相关配置
重启介质管理器后台进程,检查了NBU硬件配置,一切正常。oracle卷池现剩余5盘带,编目信息(robot inventory)与实际信息符

合,没有update的很必要。

注意:重启介质管理器后台进程后,NBU中显示进程启动成功,但还要等一段时间,才能成功地执行robot inventory操作,查询介

质相关信息;否则会没有任何信息提示,这并非介质管理器故障。

7. 重启备份策略
重新active所有当前deactive的备份策略

六、结论
驱动器需要清洗了。通过清洗,解决了清洗灯常亮的问题。

slot 7中的磁带坏了。通过删除和卸载,解决了介质故障灯常亮的问题。

因为没有新的数据带,所以没有做更换操作。

因为新的清洗带没有标签(barcode),也就不尝试更换清洗带了,待以后巡检时再检查。如果介时重复清洗故障,并且旧清洗带不

再起作用,再考虑更换。

另,操作中发现NBU中的eject功能不支持L8带库,可能是L8太低档了吧。L8名为带库(tape library),实际上更准确的称呼是自

动加裁机(autoloader),算是一种廉价带库。这种产品应该也不是SUN原产的,可能是OEM HP的。

再另,sun官方网站不提供任何L8的操作手册资料,我是从其它站点找到的资料,当然这些资料是加了sun标识的。

"-" 表示指定槽位无磁带,"!"表示指定槽位的磁带可能故障

"-" 表示指定槽位无磁带,"!"表示指定槽位的磁带可能故障

"■"表示指定槽位的磁带正加裁在驱动器中

"■"表示指定槽位的磁带正加裁在驱动器中

论坛徽章:
0
发表于 2008-12-11 15:56 |显示全部楼层
学习了,谢谢分享

论坛徽章:
0
发表于 2008-12-12 15:54 |显示全部楼层

回复 #1 rickcafe 的帖子

谢谢,学习!

论坛徽章:
0
发表于 2009-11-10 10:55 |显示全部楼层
学习了,谢谢分享

论坛徽章:
0
发表于 2009-11-22 22:29 |显示全部楼层
虽然是老贴子,但确是好贴子,很有意义。

论坛徽章:
191
15-16赛季CBA联赛之新疆
日期:2019-06-10 13:39:0515-16赛季CBA联赛之吉林
日期:2017-12-11 12:51:5915-16赛季CBA联赛之天津
日期:2017-10-30 09:57:35CU十四周年纪念徽章
日期:2017-10-13 17:10:0215-16赛季CBA联赛之福建
日期:2017-05-11 14:36:1515-16赛季CBA联赛之四川
日期:2017-04-26 19:47:1615-16赛季CBA联赛之同曦
日期:2017-03-08 08:45:47CU十四周年纪念徽章
日期:2017-03-03 10:14:3215-16赛季CBA联赛之新疆
日期:2017-02-20 15:46:5615-16赛季CBA联赛之天津
日期:2017-02-10 15:34:5315-16赛季CBA联赛之山西
日期:2017-01-11 15:00:1215-16赛季CBA联赛之广夏
日期:2017-01-11 11:28:18
发表于 2009-11-23 09:54 |显示全部楼层
学习了,感谢分享

论坛徽章:
0
发表于 2009-11-23 10:45 |显示全部楼层
谢谢,学习!

论坛徽章:
62
洛杉矶湖人
日期:2015-02-10 09:56:11黑曼巴
日期:2016-06-28 17:41:282015-2016NBA季后赛纪念章
日期:2016-06-28 17:41:282016猴年福章徽章
日期:2016-02-18 15:30:34圣安东尼奥马刺
日期:2015-05-04 22:46:00菠菜神灯
日期:2015-05-04 22:35:07新奥尔良黄蜂
日期:2015-03-17 13:54:52明尼苏达森林狼
日期:2015-03-16 21:51:15萨克拉门托国王
日期:2015-03-02 16:10:58华盛顿奇才
日期:2015-03-02 16:10:58迈阿密热火
日期:2015-03-02 16:10:582016科比退役纪念章
日期:2016-06-28 17:41:28
发表于 2009-11-23 10:55 |显示全部楼层
收藏了..
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

ITPUB技术栈

ITPUB技术栈是ITPUB企业打造的垂直于IT领域的知识社群平台,在这里,你既可以是创作者也可以是消费者。如果你的IT生涯丰富多彩,喷薄的个人价值尽可在小栈内体现;如果你渴望找到志同道合的伙伴,拓宽人脉,小栈比跑会场更快。 小栈特色:
1.极高的用户转化率,实现更直接的知识变现;
2.随时随地,刷个朋友圈的时间,实现更长效的信息沉淀;
3.戳痛、难点的专业咨询,更接近成功解决方案的时刻;
4.贴近意见领袖,个人高速成长,迈入更富有价值的人际圈。

----------------------------------------

技术小栈>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP