免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2734 | 回复: 2
打印 上一主题 下一主题

[HACMP集群] p630+aix5.2+HACMP5.1的问题求助,请大家帮忙看看 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-07-19 16:26 |只看该作者 |倒序浏览
硬件配置:P630双机+7133阵列

软件配置:aix5.2+hamcp5.1

描述下故障过程:

2号机突然重启了(重启之后的08:33:22报了SCAN_ERROR_CHRP的错误,从FRU看是CPU的问题)

但是比较奇怪的是在2号机重起之后(从1号机的cluster.07162008可以看到08:12:25 1号机就发现2号机down掉了)

1号机上的应用访问io超时

具体的时间是08:12:37(第一次)

我们的应用设置的超时时间是25秒

也即从08:12:12秒开始超时

后面又报了ADAPTER PERFORMANCE DEGRADED(08:13:36)

I/O ERROR DETECTED BY LVM (08:13:49,且出现多次)

MIRROR WRITE CACHE WRITE FAILED(08:13:49)

QUORUM LOST, VOLUME GROUP CLOSING(08:15:10)等错误

并且在08:21:32 SYSTEM SHUTDOWN BY USER

感觉是2号机的重启对1号机造成了影响

1号机重起之后

重新的接管了业务,2号机由于CPU的问题,启动的较慢,但是也顺利的加入了cluster

大家给看看这是什么问题

多谢了

ps:1号机的SSA的电池在5月底的时候更换过

目前电池的时间是在有效期之内的

info.rar

12.8 KB, 下载次数: 48

论坛徽章:
0
2 [报告]
发表于 2008-07-19 16:59 |只看该作者
建议检查1,2号机对于外部磁盘的使用方式。

论坛徽章:
0
3 [报告]
发表于 2008-07-19 20:10 |只看该作者

回复 #2 yanbing 的帖子

已经让人使用diag去收集SSA link的信息了

先准备检查下SSA卡与磁盘阵列的连接方式


从重启的前后时间上看不像备机使用了auto varyon datavg这样的参数导致

因为2号机重启之后1号机马上就重启了

不过这个参数也让人去查了

现在业务还在主机

备机的这个参数还真不好收集

呵呵
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP