Chinaunix

标题: 请教:如何判断系统死机的原因? [打印本页]

作者: iamrch    时间: 2008-08-06 01:29
标题: 请教:如何判断系统死机的原因?
一台FreeBSD6.1的机器,只有apache+php,网站几乎没有访问量,一直比较正常,最近半月每隔2~3天死机一次,如何判断是硬件原因?软件原因?外部原因?
作者: angeljyt    时间: 2008-08-06 01:29
以下是可能原因:
1.CPU耗尽
2.内存耗尽
3.程序死锁
4.网卡出问题, 或者网线被拔掉。
5.ARP劫持了网关造成网终断线,或者防火墙规则阻止访问
6. 超负载down机
7. 电源断电
作者: dierock    时间: 2008-08-06 08:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: ziggler    时间: 2008-08-06 08:51
LOG信息很重要
作者: xiaoshi20cn    时间: 2008-08-06 09:57
望闻问切

作者: iamrch    时间: 2008-08-06 12:28
/var/log下,看了半天,除了有人在穷举用户名,别的好像没看出什么来。

不过我的水平太烂,也很难看出更多的问题。

我只是想知道:如果是硬件不稳定或软件配置有问题,有什么可以作为判断的依据呢?
作者: zhengwei_zw    时间: 2008-08-06 16:05
有时候不知道怎么的,要接显示器才看的倒有些信息.而log里面根本看不倒
作者: lhm0491    时间: 2008-08-06 17:47
抛弃apache22 用nignx+fastcgi 你会爽很多
作者: huzi1986    时间: 2008-08-07 12:54
死机?这种情况不太多吧。内存用完了。计算机就和死机差不多。不管你是什么系统!
作者: iamrch    时间: 2008-08-08 17:07
我说的死机只是表现为www不能访问、ping不通ip,当然SSH也就连接不上了。因为我在异地,不能到机房现场查看机器,所以我只能打电话让机房给我重启机器。

当然,有可能只是外部无法连接,系统也许还在正常运行呢,但怎么判断呢?
作者: iamrch    时间: 2008-08-08 17:09
CU的回复真是奇怪,我从昨天就想回复,结果总是提示什么信息不对,建议关闭防火墙之类的软件。等到今天,我什么都没动,电脑一直这么放着,这次就回复成功了,搞不懂……
作者: iamrch    时间: 2008-08-12 00:07
原帖由 angeljyt 于 2008-8-8 19:01 发表
以下是可能原因:
1.CPU耗尽
2.内存耗尽
3.程序死锁
4.网卡出问题, 或者网线被拔掉。
5.ARP劫持了网关造成网终断线,或者防火墙规则阻止访问
6. 超负载down机
7. 电源断电


七种可能,4、7都不可能,其他5种,如何判断呢?有无合适的监控软件或方法?

帮忙给些建议,我确实比较头痛。

谢谢!
作者: mirnshi    时间: 2008-08-12 09:03
原帖由 iamrch 于 2008-8-12 00:07 发表


七种可能,4、7都不可能,其他5种,如何判断呢?有无合适的监控软件或方法?

帮忙给些建议,我确实比较头痛。

谢谢!

系统命令足够你监控系统状态的,首先要排除是否是网络的问题。
接上显示器,从控制台进去,查看系统状态,也可以做个循环程序,监测系统的状态。
在我的印象中,终端的中断相对网络的中断,好像是优先处理。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2