Chinaunix
标题:
系统过一段时间就down掉,急!!!
[打印本页]
作者:
liujun198069
时间:
2009-02-19 18:30
标题:
系统过一段时间就down掉,急!!!
系统过一段时间就down掉,无法ping通,控制台像死了一样,回车没有反应,关电源重启恢复正常,但过一会又重复如此,没有什么规律。
日志见附件,高手快帮帮忙。
log.rar
2009-02-19 18:30 上传
点击文件名下载附件
4.07 KB, 下载次数: 74
作者:
levine
时间:
2009-02-19 18:30
这些日志没有多少参考价值。一般来说,这种现象就是系统HANG住了,可能的原因有:文件系统满、有应用程序内存泄漏、有病毒(极少)、系统资源耗尽、主要硬件故障如PCI背板、主板、MP卡等。HBA卡坏一般不会导致HANG住系统。
查看 bdf/vmstat 5 10/ps -ef/dmesg等命令组合,多检查。
通过MP卡连接查看SL日志。
[
本帖最后由 levine 于 2009-2-21 10:56 编辑
]
作者:
liuhui1000
时间:
2009-02-19 18:43
你重启后不要开应用,先检查设备,检查一下vg状态还有pvlink。
有两个HBA卡,是不是用的多路径的,有没有把路径都加进VG里面?
[
本帖最后由 liuhui1000 于 2009-2-19 18:46 编辑
]
作者:
liujun198069
时间:
2009-02-19 19:25
没有开应用,应该和应用无关
开始也怀疑是HBA卡问题(2个HBA卡,只有1个连了光纤),将光纤移到另一个HBA卡,情况一样,2个HBA卡都不插光纤,即不连存储,情况也一样。
作者:
liuhui1000
时间:
2009-02-19 22:17
log里有很多NFS连接打开,是不是有很多NFS用户连接上了?有没有来得及看glance的?
作者:
zouxuan55555
时间:
2009-02-20 10:31
把/adapters/events/TL_adapter/1_0_2_1_0" (Threshold: >= " 3") Execute the following command to obtain event details: /opt/resmon/bin/resdata -R 141950978 -r /adapters/events/TL_adapter/1_0_2_1_0 -n 141950977 -a
执行一下.得出什么结果!
作者:
liujun198069
时间:
2009-02-20 14:37
执行了,就是那个fc.log
作者:
leelangco
时间:
2009-02-20 14:41
什么机器呢 兄弟?
到控制台上看看有什么log
另外 /opt/fcms/bin/fcmsutil <device_file> lb plm 做过了吗?
实在不行把光纤卡拔了,或许是槽位坏了
作者:
zouxuan55555
时间:
2009-02-20 15:27
1.rmsf -k -H 1/0/2/1/0
2. insf -H 1/0/2/1/0 或者重新下载安装这个光纤卡驱动;
3.要是还不行.把光纤网卡换个SLOT,
4,换卡.
作者:
easybegin
时间:
2009-02-20 16:39
每次只插一个HBA卡测试
作者:
leelangco
时间:
2009-02-20 17:12
楼主 人呢?
大家都等着悬赏讷
作者:
liujun198069
时间:
2009-02-20 22:03
谢谢大家,星期一才能试,有结果及时反馈给大家
作者:
liujun198069
时间:
2009-02-20 22:05
/opt/fcms/bin/fcmsutil <device_file> lb plm
执行了,结果正常
换槽位,和拔光纤卡,还没有试,因为说实话不会拆机器,呵呵
作者:
sayer
时间:
2009-02-23 10:57
按楼主的说法,系统不是down是hang
系统hang的处理办法是
1)做TOC,重启后分析/var/adm/crash下的文件
2)检查是否有HPMC发生,分析/var/tombstones/MCAxxxx文件
作者:
htg407
时间:
2009-02-23 17:49
同意楼上的
IA的机器看mca文件
PA的机器看ts99文件
作者:
liujun198069
时间:
2009-02-23 18:11
搞定了,CPU坏了,怎么给分啊?
作者:
五“宅”一生
时间:
2009-02-23 20:50
cpu坏了的话一般报错会很明显的啊。
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2