免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6770 | 回复: 12
打印 上一主题 下一主题

3320故障重现,原因未知,请帮忙分析一下。 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-08-25 08:35 |只看该作者 |倒序浏览
本帖最后由 wenyy_unix 于 2011-08-25 08:38 编辑

兄弟们,红色部份的日志在8月18日出现过,引起数据丢失,没想昨天又出现同样的报错,然后提示12号盘BAD,难道是控制器或者SCSI卡有问题吗?
Aug 20 09:24:11 osssvr gdm[20214]: [ID 702911 daemon.error] gdm_slave_xioerror_handler: Fatal X error - Restarting :0
Aug 20 09:24:14 osssvr gdm[21092]: [ID 702911 daemon.error] gdm_slave_xioerror_handler: Fatal X error - Restarting :0
Aug 20 09:24:14 osssvr gdm[20169]: [ID 702911 daemon.error] Failed to start X server several times in a short time period; disabling display :0
Aug 20 17:00:52 osssvr picld[170]: [ID 339875 daemon.error] Keyswitch position changed to NORMAL
Aug 22 17:01:09 osssvr genunix: [ID 408114 kern.info] /pci@9,600000/pci@2/network@0 (ce0) online
Aug 22 17:01:09 osssvr genunix: [ID 408114 kern.info] /pci@9,600000/pci@2/network@1 (ce1) online
Aug 24 17:55:19 osssvr scsi: [ID 107833 kern.warning] WARNING: /pci@9,600000/scsi@1/sd@0,1 (sd50):
Aug 24 17:55:19 osssvr         Error for Command: write                   Error Level: Retryable
Aug 24 17:55:19 osssvr scsi: [ID 107833 kern.notice]         Requested Block: 253616                    Error Block: 253616
Aug 24 17:55:19 osssvr scsi: [ID 107833 kern.notice]         Vendor: SUN                                Serial Number: 621D8172-01
Aug 24 17:55:19 osssvr scsi: [ID 107833 kern.notice]         Sense Key: Unit Attention
Aug 24 17:55:19 osssvr scsi: [ID 107833 kern.notice]         ASC: 0x29 (power on, reset, or bus reset occurred), ASCQ: 0x0, FRU: 0x0
Aug 24 17:55:28 osssvr SUNWscsdMonitor[932]: [ID 838682 daemon.error] [SUNWscsd 0x020B1E06:0x0100000C Warning] <rctrl3001> Standard General Event, CHL:0 ID:12  Target ALERT: SCSI Parity/CRC Error Detected.[info: 3-000307F43] (Primary, Wed Aug 24 16:04:49 2011) {Unique ID#: 094c01}
Aug 24 17:56:48 osssvr scsi: [ID 107833 kern.warning] WARNING: /pci@9,600000/scsi@1 (mpt0):
Aug 24 17:56:48 osssvr         Disconnected command timeout for Target 0
Aug 24 17:56:49 osssvr scsi: [ID 107833 kern.warning] WARNING: /pci@9,600000/scsi@1/sd@0,1 (sd50):
Aug 24 17:56:49 osssvr         SCSI transport failed: reason 'reset': retrying command
Aug 24 17:56:52 osssvr scsi: [ID 107833 kern.warning] WARNING: /pci@9,600000/scsi@1/sd@0,1 (sd50):
Aug 24 17:56:52 osssvr         Error for Command: write(10)               Error Level: Retryable
Aug 24 17:56:52 osssvr scsi: [ID 107833 kern.notice]         Requested Block: 155848768                 Error Block: 155848768
Aug 24 17:56:52 osssvr scsi: [ID 107833 kern.notice]         Vendor: SUN                                Serial Number: 621D8172-01
Aug 24 17:56:52 osssvr scsi: [ID 107833 kern.notice]         Sense Key: Unit Attention
Aug 24 17:56:52 osssvr scsi: [ID 107833 kern.notice]         ASC: 0x29 (power on, reset, or bus reset occurred), ASCQ: 0x0, FRU: 0x0
Aug 24 17:57:50 osssvr SUNWscsdMonitor[932]: [ID 261232 daemon.error] [SUNWscsd 0x020B1E05:0x0100000C Warning] <rctrl3001> Standard General Event, CHL:0 ID:12  Target ALERT: Timeout Waiting for I/O to Complete.[info: 4-0003080D1] (Primary, Wed Aug 24 16:05:39 2011) {Unique ID#: 094c01}
Aug 24 17:57:50 osssvr SUNWscsdMonitor[932]: [ID 524315 daemon.error] [SUNWscsd 0x020B1E05:0x0100000C Warning] <rctrl3001> Standard General Event, CHL:0 ID:12  Target ALERT: Timeout Waiting for I/O to Complete.[info: 5-0003081C9] (Primary, Wed Aug 24 16:06:10 2011) {Unique ID#: 094c01}
Aug 24 17:57:50 osssvr SUNWscsdMonitor[932]: [ID 250382 daemon.error] [SUNWscsd 0x010B2001:0x0000000C Critical] <rctrl3001> Standard General Event, LG:0 Logical Drive ALERT: CHL:0 ID:12  Drive Failure.[info: 6-0003081C9] (Primary, Wed Aug 24 16:06:10 2011) {Unique ID#: 094c01}
Aug 24 17:57:50 osssvr SUNWscsdMonitor[932]: [ID 764575 daemon.error] [SUNWscsd 0x030B2006:0x0000FFFF Informational] <rctrl3001> Standard General Event, LG:0 Logical Drive NOTICE: Starting Rebuild.[info: 7-0003081DC] (Primary, Wed Aug 24 16:06:12 2011) {Unique ID#: 094c01}
Aug 24 17:57:50 osssvr SUNWscsdMonitor[932]: [ID 522636 daemon.error] [SUNWscsd 0x010B0301:0x0000000C Critical] <rctrl3001> Disk Device (SN 000836ABS8DC        ) at [0:12] has failed. {Unique ID#: 094c01}

论坛徽章:
1
操作系统版块每日发帖之星
日期:2016-01-15 06:20:00
2 [报告]
发表于 2011-08-25 09:17 |只看该作者
这得先把12号硬盘换了

论坛徽章:
0
3 [报告]
发表于 2011-08-25 09:38 |只看该作者
12号盘已经换了,但是六天内出现同样的报错,上周报错后12号盘已经换过一次了。

论坛徽章:
1
19周年集字徽章-19
日期:2020-01-08 15:08:20
4 [报告]
发表于 2011-08-25 11:10 |只看该作者
你能保证新换的12号没有问题?坏盘是很正常的。
还有就可能是3320的背板有问题了。

论坛徽章:
0
5 [报告]
发表于 2011-08-25 11:49 |只看该作者
磁盘通道发生故障

论坛徽章:
0
6 [报告]
发表于 2011-08-25 15:15 |只看该作者
十二号硬盘没看出来有问题啊

论坛徽章:
0
7 [报告]
发表于 2011-08-30 15:42 |只看该作者
想确定问题,就仔细检查下咯,主机IO卡,scsi线缆,存储接口等等.你连个console到3320上去看看有没有什么告警,然后,看看scsi线有没有弯曲或折的地方,然后检查主机的io卡,通道,做io读写测试,看lg是否有大量的hard error之类的.如果都正常,那就确实是运气不好,统一槽位的硬盘连着坏,这也不是奇怪,我就遇到过.

论坛徽章:
0
8 [报告]
发表于 2011-08-31 12:55 |只看该作者
谢谢楼上的。

论坛徽章:
0
9 [报告]
发表于 2011-09-02 13:47 |只看该作者
出来混重要还的,SUN的问题 无奇不有

论坛徽章:
0
10 [报告]
发表于 2011-09-03 13:52 |只看该作者
整机更换
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP