- 论坛徽章:
- 0
|
硬件配置:P630双机+7133阵列
软件配置:aix5.2+hamcp5.1
描述下故障过程:
2号机突然重启了(重启之后的08:33:22报了SCAN_ERROR_CHRP的错误,从FRU看是CPU的问题)
但是比较奇怪的是在2号机重起之后(从1号机的cluster.07162008可以看到08:12:25 1号机就发现2号机down掉了)
1号机上的应用访问io超时
具体的时间是08:12:37(第一次)
我们的应用设置的超时时间是25秒
也即从08:12:12秒开始超时
后面又报了ADAPTER PERFORMANCE DEGRADED(08:13:36)
I/O ERROR DETECTED BY LVM (08:13:49,且出现多次)
MIRROR WRITE CACHE WRITE FAILED(08:13:49)
QUORUM LOST, VOLUME GROUP CLOSING(08:15:10)等错误
并且在08:21:32 SYSTEM SHUTDOWN BY USER
感觉是2号机的重启对1号机造成了影响
1号机重起之后
重新的接管了业务,2号机由于CPU的问题,启动的较慢,但是也顺利的加入了cluster
大家给看看这是什么问题
多谢了
ps:1号机的SSA的电池在5月底的时候更换过
目前电池的时间是在有效期之内的 |
|