gzy512 发表于 2013-08-06 16:50

rp5470自动重启啊,,很频繁,怎么办

今天下午,交换机故障,导致cluster错乱,所有群集服务器都发生了重启,交换机故障处理完毕后,所有cluster中的服务器都恢复正常,就其中一台会出现自动重启事件,大虾帮忙看看啊

more/etc/shutownlog
13:43Tue Aug 06 2013.Reboot after panic: SafetyTimer expired, isr.ior = 0'10
2401ac.0'509430d0
15:46Tue Aug 06 2013.Reboot after panic: SafetyTimer expired, isr.ior = 0'24
0003.0'1a4684d8
16:26Tue Aug 06 2013.Reboot after panic: SafetyTimer expired, isr.ior = 0'24
0003.0'1a4684d8

yfjc0010]/var/adm/crash# ll
total 128
-rwxr-xr-x   1 root       root             2 Aug6 16:26 bounds

lbseraph 发表于 2013-08-06 20:18

这个可能是MCSG触发TOC的,一个简单的判断:把这个节点踢出cluster,观察两三个小时(上面的shutdown记录是隔一两小时就会重启)看看是否稳定,稳定的话就说明OS层面是没有问题的。之后就看MCSG的日志吧~之前有问题的是网络交换机么?心跳线是否经这个交换机?如果是的话检查这个节点对应的网线链路是否稳定。

参考链接:
http://h30499.www3.hp.com/t5/System-Administration/Reboot-after-panic-SafetyTimer-expired-isr-ior-0-3400d4-0/td-p/4077813#.UgDnf5LDBkY
http://h30499.www3.hp.com/t5/System-Administration/Reboot-after-panic/td-p/3140521#.UgDniZLDBkY

haizdl 发表于 2013-08-06 20:52

找HP去分析crashinfo吧,猜测没有用!

杭州的根号 发表于 2013-08-08 10:43

GSP卡里的报错信息,core文件,有了这些就能分析了
---------------------------------------------------------------------------------------
高价回收HP服务器整机和上面备件,好坏都收,站内短信联系或者QQ:2407509497

lbseraph 发表于 2013-08-08 16:07

回复 3# haizdl

对方的/var/adm/crash没有生成dump,LZ已经贴出来了。
   

haizdl 发表于 2013-08-08 21:27

本帖最后由 haizdl 于 2013-08-08 21:34 编辑

回复 5# lbseraph

那只能看双机的两个节点的syslog了

   

jat_15 发表于 2013-08-11 19:01

看看event.log,syslog.log了。

gzy512 发表于 2013-09-04 13:21

确认是网络问题导致的cluster故障,退出cmcluster,单独运行至今,一切正常:victory:
页: [1]
查看完整版本: rp5470自动重启啊,,很频繁,怎么办