免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2820 | 回复: 3
打印 上一主题 下一主题

奇怪的硬盘问题:MESSAGES报告ERROR可系统正常运行 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-01-14 10:34 |只看该作者 |倒序浏览
各位大侠:
这两天遇到一奇怪问题:
硬件:SUN FIRE V250, 4 SCSI HD (73G), ROOT FS 由两块MIRROR成, OS: SOLARIS 9 With SUn Volume Manager
MESSAGES 显示0号硬盘读写错误(only part of them):
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.warning] WARNING: /pci@1d,700000/scsi@4/sd@0,0 (sd0):
Jan  1 11:04:01 sun2    Error for Command: write(10)               Error Level: Retryable
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Requested Block: 139704496                 Error Block: 139704496
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Vendor: SEAGATE                            Serial Number: 0402B6RQM8
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Sense Key: Unit Attention
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      ASC: 0x29 (<vendor unique code 0x29>), ASCQ: 0x3, FRU: 0x4
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.warning] WARNING: /pci@1d,700000/scsi@4/sd@0,0 (sd0):
Jan  1 11:04:01 sun2    Error for Command: write(10)               Error Level: Informational
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Requested Block: 142820212                 Error Block: 142820212
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Vendor: SEAGATE                            Serial Number: 0402B6RQM8
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Sense Key: Soft Error
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      ASC: 0x5d (drive operation marginal, service immediately (failure prediction threshold excee
ded)), ASCQ: 0x0, FRU: 0x5
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.warning] WARNING: /pci@1d,700000/scsi@4/sd@0,0 (sd0):
Jan  1 11:06:41 sun2    Error for Command: write(10)               Error Level: Retryable
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.notice]      Requested Block: 142820212                 Error Block: 142820212
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.notice]      Vendor: SEAGATE                            Serial Number: 0402B6RQM8
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.notice]      Sense Key: Hardware Error
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.notice]      ASC: 0x32 (no defect spare location available), ASCQ: 0x0, FRU: 0x4
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.warning] WARNING: /pci@1d,700000/scsi@4/sd@0,0 (sd0):
Jan  1 11:06:42 sun2    Error for Command: write(10)               Error Level: Retryable
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.notice]      Requested Block: 142820212                 Error Block: 142820212
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.notice]      Vendor: SEAGATE                            Serial Number: 0402B6RQM8
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.notice]      Sense Key: Hardware Error
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.notice]      ASC: 0x32 (no defect spare location available), ASCQ: 0x0, FRU: 0x4

IOSTAT -EN也显示同样问题. 可是METASTAT 却显示所有分区OK, 并且USER也没记得遇到读写错误. ORACLE数据库运行正常(一部分数据文件在ROOT上). W我试着光驱启动并FSCK硬盘分区,发现有数据坏块(只有一两块), 以及REFERENCE不对等小问题, 并回答"Y"修正这些问题, 然后发现, 修正后的硬盘不能METAREPLACE, 报告一些块读不到. 于是, 拿原来0号盘(本来想换下来的坏盘), 重新与一块新盘做MIRROR, 居然没有任何问题, 而且整个系统完全恢复了.

现在, 我很迷惑:这0号盘究竟是不是真有问题?

先谢了!

论坛徽章:
0
2 [报告]
发表于 2008-01-14 11:00 |只看该作者
有两个坏块,位置已经告诉你了,坏块多起来的时候,盘就该换了。

论坛徽章:
0
3 [报告]
发表于 2008-01-15 09:52 |只看该作者
大师,, retryable    是否一定更换了?我看到有的书上说 有隐患  但是不是物理错误  。

论坛徽章:
0
4 [报告]
发表于 2008-01-15 10:09 |只看该作者
原帖由 tzpi2000 于 2008-1-15 09:52 发表
大师,, retryable    是否一定更换了?我看到有的书上说 有隐患  但是不是物理错误  。

拆开重新fsck一下试试就知道了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP