免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5390 | 回复: 9
打印 上一主题 下一主题

【求助】SUN T2000硬盘出现Hard Errors,情况相当诡异 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-03-02 16:35 |只看该作者 |倒序浏览
相当诡异的硬盘故障\r\n环境:\r\n1、客户有四块盘,分别为:c0t0d0  c0t1d0  c0t2d0 c0t3d0\r\n2、其中c0t0d0  c0t1d0做硬件RAID,c0t2d0 c0t3d0没有做RAID。\r\n3、c0t2d0s0挂载到/app/bak目录,c0t3d0s0挂载到/app/sou目录。\r\n4、通过iostat -E命令,查看得知c0t2d0报了很多hard error和Media Error。\r\n   结果如下:\r\n   sd1       Soft Errors: 29 Hard Errors: 1132 Transport Errors: 0 \r\nVendor: SEAGATE  Product: ST973435LSUN72G  Revision: 0566 Serial No: 063710ZFLL \r\nSize: 73.41GB <73407865856 bytes>\r\nMedia Error: 978 Device Not Ready: 0 No Device: 154 Recoverable: 29 \r\nIllegal Request: 0 Predictive Failure Analysis: 82 \r\n    但是c0t3d0没有相关报错,结果如下:\r\n    sd3       Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 \r\nVendor: FUJITSU  Product: MAY2073RCSUN72G  Revision: 0501 Serial No: 0735S0DPCF \r\nSize: 73.40GB <73400057856 bytes>\r\nMedia Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 \r\nIllegal Request: 0 Predictive Failure Analysis: 0 \r\n5、但是非常奇怪的是,c0t2d0s0挂载到/app/bak目录可以正常使用,c0t3d0s0挂载到/app/sou目录反而无法进入,报I/O error。\r\n6、客户就叫我们换c0t3d0这块硬盘,但是更换不成功,估计是第三方的硬盘,机器不支持,插上后不认识。\r\n7、没办法,我之后把原来的盘重新换上去,结果让人惊喜又郁闷,重新挂载后,那个目录居然可以正常使用了。\r\n8、但是在这个换盘过程中,iostat -E,发现又有变化:\r\n   sd1       Soft Errors: 29 Hard Errors: 1132 Transport Errors: 0 \r\nVendor: SEAGATE  Product: ST973401LSUN72G  Revision: 0556 Serial No: 063710ZF0M \r\nSize: 73.41GB <73407865856 bytes>\r\nMedia Error: 978 Device Not Ready: 0 No Device: 154 Recoverable: 29 \r\nIllegal Request: 0 Predictive Failure Analysis: 82 \r\n\r\n     sd3       Soft Errors: 0 Hard Errors: 414 Transport Errors: 0 \r\nVendor: FUJITSU  Product: MAY2073RCSUN72G  Revision: 0501 Serial No: 0735S0DPBV \r\nSize: 73.40GB <73400057856 bytes>\r\nMedia Error: 0 Device Not Ready: 414 No Device: 0 Recoverable: 0 \r\nIllegal Request: 0 Predictive Failure Analysis: 0 \r\n    主要是sd3,这里Hard Errors和Device Not Ready都增加到414次,我想知道,大概什么原因导致的。\r\n9、c0t2d0 这块硬盘虽然保了很多hard error和Media Error,但是可以正常使用。

论坛徽章:
0
2 [报告]
发表于 2010-03-02 16:37 |只看该作者
sd3的Hard Errors和Device Not Ready都从0增加到414次,会不会是因为我在换上新盘后,对新盘进行操作而产生的呢?\r\n\r\n\r\n还有就是这个计数,我要怎么才能消除呢?重新启动操作系统吗?

论坛徽章:
0
3 [报告]
发表于 2010-03-02 18:03 |只看该作者
你把俩快盘的数据备份下,然后把盘fsck试试  如果不行就建议换硬盘

论坛徽章:
0
4 [报告]
发表于 2010-03-03 11:25 |只看该作者
你重启过吗?可以试着重启,看看什么情况

论坛徽章:
0
5 [报告]
发表于 2010-03-03 13:18 |只看该作者
重启就清零了!但是一般硬盘的Hard error错误到100以上就要换硬盘了,你现在都到1000多了,还是把盘换了吧

论坛徽章:
0
6 [报告]
发表于 2010-03-03 13:40 |只看该作者
看看messages的报错,建议更换硬盘,format里面的ana可以分析,分析的过程中可能会自己修复,如果不修复可以使用repair修复,但是不是所有错误都能修复的

论坛徽章:
0
7 [报告]
发表于 2010-03-03 14:27 |只看该作者
本帖最后由 easybegin 于 2010-03-03 14:28 编辑 \n\n你到底咋操作的?  换盘sd3后又换了回去,为啥前后sd3的sn不一样。\r\n\r\n如果sd1没有被更换的话,请问换sd3盘前后为啥sd1的sn也不一样?\r\n\r\n请搞清楚现在留在系统中的sn到底是原来硬盘的,还是你换的盘的等等

论坛徽章:
0
8 [报告]
发表于 2010-03-03 18:08 |只看该作者
通过检查日志,一直有以下报错信息:\r\nFeb 11 15:55:26 swlhapp1 scsi: [ID 107833 kern.warning] WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd1):\r\nFeb 11 15:55:26 swlhapp1        Error for Command: read(10)                Error Level: Informational\r\nFeb 11 15:55:26 swlhapp1 scsi: [ID 107833 kern.notice]  Requested Block: 51512880                  Error Block: 51512880\r\nFeb 11 15:55:26 swlhapp1 scsi: [ID 107833 kern.notice]  Vendor: SEAGATE                            Serial Number: 063710ZF0M  \r\nFeb 11 15:55:26 swlhapp1 scsi: [ID 107833 kern.notice]  Sense Key: Soft Error\r\nFeb 11 15:55:26 swlhapp1 scsi: [ID 107833 kern.notice]  ASC: 0x5d (drive operation marginal, service immediately (failure prediction threshold exceeded)), ASCQ: 0x0, FRU: 0x10\r\nFeb 11 15:55:28 swlhapp1 scsi: [ID 107833 kern.warning] WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd1):\r\nFeb 11 15:55:28 swlhapp1        Error for Command: read(10)                Error Level: Retryable\r\nFeb 11 15:55:28 swlhapp1 scsi: [ID 107833 kern.notice]  Requested Block: 51611312                  Error Block: 51611316\r\nFeb 11 15:55:28 swlhapp1 scsi: [ID 107833 kern.notice]  Vendor: SEAGATE                            Serial Number: 063710ZF0M  \r\nFeb 11 15:55:28 swlhapp1 scsi: [ID 107833 kern.notice]  Sense Key: Media Error\r\nFeb 11 15:55:28 swlhapp1 scsi: [ID 107833 kern.notice]  ASC: 0x11 (unrecovered read error), ASCQ: 0x0, FRU: 0xe4\r\nFeb 11 15:55:29 swlhapp1 scsi: [ID 107833 kern.warning] WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd1):\r\nFeb 11 15:55:29 swlhapp1        Error for Command: read(10)                Error Level: Retryable\r\nFeb 11 15:55:29 swlhapp1 scsi: [ID 107833 kern.notice]  Requested Block: 51611312                  Error Block: 51611316\r\nFeb 11 15:55:29 swlhapp1 scsi: [ID 107833 kern.notice]  Vendor: SEAGATE                            Serial Number: 063710ZF0M  \r\nFeb 11 15:55:29 swlhapp1 scsi: [ID 107833 kern.notice]  Sense Key: Media Error\r\nFeb 11 15:55:29 swlhapp1 scsi: [ID 107833 kern.notice]  ASC: 0x11 (unrecovered read error), ASCQ: 0x0, FRU: 0xf\r\nFeb 11 15:55:31 swlhapp1 scsi: [ID 107833 kern.warning] WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd1):\r\nFeb 11 15:55:31 swlhapp1        Error for Command: read(10)                Error Level: Retryable\r\nFeb 11 15:55:31 swlhapp1 scsi: [ID 107833 kern.notice]  Requested Block: 51611312                  Error Block: 51611316\r\nFeb 11 15:55:31 swlhapp1 scsi: [ID 107833 kern.notice]  Vendor: SEAGATE                            Serial Number: 063710ZF0M  \r\nFeb 11 15:55:31 swlhapp1 scsi: [ID 107833 kern.notice]  Sense Key: Media Error\r\nFeb 11 15:55:31 swlhapp1 scsi: [ID 107833 kern.notice]  ASC: 0x11 (unrecovered read error), ASCQ: 0x0, FRU: 0xf

论坛徽章:
0
9 [报告]
发表于 2010-03-04 16:52 |只看该作者
谢谢各位的帮助,我已经将硬盘进行了更换,问题得到解决。

论坛徽章:
0
10 [报告]
发表于 2010-03-08 17:24 |只看该作者
he真能搞,尽弄些山寨悲剧。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP