免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3711 | 回复: 10
打印 上一主题 下一主题

[AIX] RS6000高手请进 谢谢 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2004-10-24 22:54 |只看该作者 |倒序浏览
主机7026-m80。\r\n最近经常出现Crash。\r\nLED显示为 888 102 300 0c0  和 888 102 605 0c5\r\n我查过,意思为:\r\n“300  Data storage interrupt from the processor.\r\n0c5  Dump Did Not Start or Dump Crashed.”\r\n也就是说系统出现意外数据中断,导致Crash。\r\n\r\n重新启动后系统做errpt有如下报错。\r\nIDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION\r\n0BA49C99   1024183004 T H scsi1          SCSI BUS ERROR\r\n0BA49C99   1024182404 T H scsi1          SCSI BUS ERROR\r\n1581762B   1024181104 T H hdisk0         DISK OPERATION ERROR\r\n0BA49C99   1024181104 T H scsi0          SCSI BUS ERROR\r\n613E5F38   1024181104 P H LVDD           I/O ERROR DETECTED BY LVM\r\n1581762B   1024181104 T H hdisk0         DISK OPERATION ERROR\r\n0BA49C99   1024181104 T H scsi0          SCSI BUS ERROR\r\n\r\nSCSI0和SCSI1(Wide/Ultra-2 SCSI I/O Controller)应该是连接内置硬盘和SCSI的IO设备的总线。\r\n根据经验判断,应该是系统SCSI线上的传输出了问题。\r\n\r\n对SCIS0、sysplanar0 、SCSI1、HDISK0、HDISK1做DIAG。\r\nVerify时没有报错。做Problem Determination时出现如下信息:\r\n1、Ref. code: B1194690\r\n2、62D-129: Error log analysis indicates a SCSI bus problem.\r\n        SCSI bus problem: cables, terminators or other SCSI devices\r\n        hdisk0   FRU: 07N3778            9.1GB\r\n        PCI2        FRU: 04N6907\r\n        ···\r\n        ··\r\n        ·\r\n\r\n根据(1)的解释“B1xx 4690 Service processor firmware/AIX\r\ninterface problem detected Call second level of support”,我查了系统的微码为“System Firmware: M2P01113 Plarform Firmware: MM010507”。于是把当前微码升级到最新。重新启动后errpt里依旧有新的类似错误信息。\r\n\r\n另外一台做HA的机器上也有类似SCSI1的报错。\r\n\r\n#############################################\r\n\r\n目前的主要问题就是对“0BA49C99   1024181104 T H scsi0          SCSI BUS ERROR”这样的问题束手无策。我以前也碰到过几次类似的报错,但没这么频繁过。以前报错以后甚至偶尔会出现内置硬盘找不到的情况。真不知道该怎么解决。

论坛徽章:
0
2 [报告]
发表于 2004-10-25 08:20 |只看该作者
建议你用diag盘检测一下\r\n估计应该是内置硬盘有坏块了

论坛徽章:
0
3 [报告]
发表于 2004-10-25 09:35 |只看该作者
diag盘查过了。没有硬盘坏。DISK 0和1的 OPERATION ERROR都在报的。\r\n我更怀疑是SCSI0不稳定。\r\n以前就碰到过这种情况。偶尔甚至会出现两块内置盘都找不到的情况。

论坛徽章:
0
4 [报告]
发表于 2005-12-20 19:44 |只看该作者

Re: [AIX] RS6000高手请进 谢谢

[QUOTE]最初由 Adkel 发布\r\n[B]主机7026-m80。\r\n最近经常出现Crash。\r\nLED显示为 888 102 300 0c0  和 888 102 605 0c5\r\n我查过,意思为:\r\n“300  Data storage interrupt from the processor.\r\n0c5  Dump Did Not Start or Dump Crashed.”\r\n也就是说系统出现意外数据中断,导致Crash。\r\n\r\n\r\n我这里也遇到这种问题,哪位高手能给个解释先?

论坛徽章:
0
5 [报告]
发表于 2005-12-21 14:04 |只看该作者
可能内存坏了,或者内存接触不好?需要窒息分析dump,先要把dump做出来。

论坛徽章:
0
6 [报告]
发表于 2006-05-15 10:04 |只看该作者
最初由 orian 发布\r\n[B]可能内存坏了,或者内存接触不好?需要窒息分析dump,先要把dump做出来。 [/B]
\r\n\r\n建议,相当有创意。很可能与此相关。\r\n不知道楼主的情况,最后怎么处理了?

论坛徽章:
0
7 [报告]
发表于 2006-05-16 23:23 |只看该作者
最初由 orian 发布\r\n[B]可能内存坏了,或者内存接触不好?需要窒息分析dump,先要把dump做出来。 [/B]
\r\n\r\n我怎么胡说八道?哈哈,可能睡着了。。。\r\n\r\n\r\n现在没看300的意思,看errpt大概是scsi卡和线的问题\r\n\r\n当然,300 dump也不排除内存的故障,好上是software checkstop

论坛徽章:
0
8 [报告]
发表于 2006-05-18 00:17 |只看该作者
2004年的贴子,不知道楼主怎么解决的.

论坛徽章:
0
9 [报告]
发表于 2006-05-18 08:04 |只看该作者
呵呵,这么老的帖子也翻出来了\r\n最近我也遇到了一个这样的问题,A机系统宕机的时候B机报SSA开环,SSA性能降级\r\norian斑竹,你用什么方式分析DUMP?

论坛徽章:
0
10 [报告]
发表于 2006-05-19 15:35 |只看该作者
可以看看系统驱动的日志。alog -t boot -o应该可以提供很多信息。在试着更换下scis线路。排除看看问题在那。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP