Chinaunix

标题: 系统过一段时间就down掉,急!!! [打印本页]

作者: liujun198069    时间: 2009-02-19 18:30
标题: 系统过一段时间就down掉,急!!!
系统过一段时间就down掉,无法ping通,控制台像死了一样,回车没有反应,关电源重启恢复正常,但过一会又重复如此,没有什么规律。

日志见附件,高手快帮帮忙。

log.rar

4.07 KB, 下载次数: 74


作者: levine    时间: 2009-02-19 18:30
这些日志没有多少参考价值。一般来说,这种现象就是系统HANG住了,可能的原因有:文件系统满、有应用程序内存泄漏、有病毒(极少)、系统资源耗尽、主要硬件故障如PCI背板、主板、MP卡等。HBA卡坏一般不会导致HANG住系统。
查看 bdf/vmstat 5 10/ps -ef/dmesg等命令组合,多检查。
通过MP卡连接查看SL日志。

[ 本帖最后由 levine 于 2009-2-21 10:56 编辑 ]
作者: liuhui1000    时间: 2009-02-19 18:43
你重启后不要开应用,先检查设备,检查一下vg状态还有pvlink。
有两个HBA卡,是不是用的多路径的,有没有把路径都加进VG里面?

[ 本帖最后由 liuhui1000 于 2009-2-19 18:46 编辑 ]
作者: liujun198069    时间: 2009-02-19 19:25
没有开应用,应该和应用无关

开始也怀疑是HBA卡问题(2个HBA卡,只有1个连了光纤),将光纤移到另一个HBA卡,情况一样,2个HBA卡都不插光纤,即不连存储,情况也一样。
作者: liuhui1000    时间: 2009-02-19 22:17
log里有很多NFS连接打开,是不是有很多NFS用户连接上了?有没有来得及看glance的?
作者: zouxuan55555    时间: 2009-02-20 10:31
把/adapters/events/TL_adapter/1_0_2_1_0"     (Threshold:  >= " 3")    Execute the following command to obtain event details:   /opt/resmon/bin/resdata -R 141950978 -r /adapters/events/TL_adapter/1_0_2_1_0 -n 141950977 -a
执行一下.得出什么结果!
作者: liujun198069    时间: 2009-02-20 14:37
执行了,就是那个fc.log
作者: leelangco    时间: 2009-02-20 14:41
什么机器呢 兄弟?
到控制台上看看有什么log

另外 /opt/fcms/bin/fcmsutil <device_file> lb plm 做过了吗?

实在不行把光纤卡拔了,或许是槽位坏了
作者: zouxuan55555    时间: 2009-02-20 15:27
1.rmsf -k -H 1/0/2/1/0
2. insf -H 1/0/2/1/0 或者重新下载安装这个光纤卡驱动;
3.要是还不行.把光纤网卡换个SLOT,
4,换卡.
作者: easybegin    时间: 2009-02-20 16:39
每次只插一个HBA卡测试
作者: leelangco    时间: 2009-02-20 17:12
楼主 人呢?

大家都等着悬赏讷
作者: liujun198069    时间: 2009-02-20 22:03
谢谢大家,星期一才能试,有结果及时反馈给大家
作者: liujun198069    时间: 2009-02-20 22:05
/opt/fcms/bin/fcmsutil <device_file> lb plm
执行了,结果正常

换槽位,和拔光纤卡,还没有试,因为说实话不会拆机器,呵呵
作者: sayer    时间: 2009-02-23 10:57
按楼主的说法,系统不是down是hang
系统hang的处理办法是
1)做TOC,重启后分析/var/adm/crash下的文件
2)检查是否有HPMC发生,分析/var/tombstones/MCAxxxx文件
作者: htg407    时间: 2009-02-23 17:49
同意楼上的
IA的机器看mca文件
PA的机器看ts99文件
作者: liujun198069    时间: 2009-02-23 18:11
搞定了,CPU坏了,怎么给分啊?
作者: 五“宅”一生    时间: 2009-02-23 20:50
cpu坏了的话一般报错会很明显的啊。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2