Chinaunix

标题: FreeBSD的机器经常假死,帮忙分析一下 [打印本页]

作者: cell1999    时间: 2005-06-21 12:02
标题: FreeBSD的机器经常假死,帮忙分析一下
机器配置:Xeon2.8G*2,内存2G,硬盘scsi36G

系统环境:FreeBSD5.3+Aapache2.0.54+PHP

症状:开启WEB服务一段时间以后,WEB不能访问,ping不通

因为此机器上的WEB服务流量较大,当把访问量转移到其他机器后,大概1分钟时间此机器上的WEB可以访问,能ping通,机器并没有死机,而是一种假死的状态,当把访问量再转回些机器时,一段时间(大概2分钟)后又不能访问。

已作过的处理:重装过系统,更换过网线和交换机端口,更换过网卡,现象依然

些问题已纠缠我三天了,请各位侠侠们能帮我分析一下什么原因,帮我出出主意,万分感谢中...
作者: notany2005    时间: 2005-06-21 20:24
标题: FreeBSD的机器经常假死,帮忙分析一下
什么都没有谁也没办法
把什么 配置都古道上来
作者: 剑心通明    时间: 2005-06-21 20:39
标题: FreeBSD的机器经常假死,帮忙分析一下
流量有多大啊?
作者: cell1999    时间: 2005-06-22 13:58
标题: FreeBSD的机器经常假死,帮忙分析一下
流量不是太大,大概20M,机房是这么说的

是浪潮的品牌机,型号是NF180

两块2.8G的至强CPU,主板集成的两个千兆网卡

里面的东西除了内存用的是sumsung的,其他都是浪潮的原装配件
作者: 剑心通明    时间: 2005-06-22 17:37
标题: FreeBSD的机器经常假死,帮忙分析一下
建议楼主换个服务器试试,也许是硬件在bsd下支持的不够好?
作者: cell1999    时间: 2005-06-22 23:52
标题: FreeBSD的机器经常假死,帮忙分析一下
这台服务器从去年10月份开始运行到今天,一直比较稳定,只不过原来这么大的流量,大概在10M多
作者: z00    时间: 2005-06-23 04:39
标题: FreeBSD的机器经常假死,帮忙分析一下
散热
作者: 剑心通明    时间: 2005-06-23 11:24
标题: FreeBSD的机器经常假死,帮忙分析一下
[quote]原帖由 "z00"]散热[/quote 发表:

也有可能的,昨天我们都上不去网了,我找了N久,最后发现因为空调很长时间没有清洗,工作不正常,导致核心交换机死掉了,全部都上不去网了,晕死了,让我好找啊
作者: gig2600    时间: 2005-06-23 12:47
标题: FreeBSD的机器经常假死,帮忙分析一下
把netstat -m 结果贴出来看看
作者: cell1999    时间: 2005-06-23 21:55
标题: FreeBSD的机器经常假死,帮忙分析一下
netstat -n
爆多的记录出来,状态主要是这两种:
FIN_WAIT_1
FIN_WAIT_2

今天换了一台服务器,正在测试中,发现有些地方能通,有些地方不能通,可能不是机器问题,而是路由问题
继续观察中...
作者: blackbox    时间: 2005-06-23 23:05
标题: FreeBSD的机器经常假死,帮忙分析一下
贴netstat -m 不是 -n
作者: cell1999    时间: 2005-06-23 23:07
标题: FreeBSD的机器经常假死,帮忙分析一下

作者: cell1999    时间: 2005-06-23 23:09
标题: FreeBSD的机器经常假死,帮忙分析一下
在这里

  1. 101814 mbufs in use
  2. 4294936240/25600 mbuf clusters in use (current/max)
  3. 76/93/6656 sfbufs in use (current/peak/max)
  4. 4157645 KBytes allocated to network
  5. 0 requests for sfbufs denied
  6. 0 requests for sfbufs delayed
  7. 86 requests for I/O initiated by sendfile
  8. 0 calls to protocol drain routines
复制代码

作者: 剑心通明    时间: 2005-06-24 07:24
标题: FreeBSD的机器经常假死,帮忙分析一下
4294936240/25600 mbuf clusters in use (current/max)

作者: cell1999    时间: 2005-06-24 08:20
标题: FreeBSD的机器经常假死,帮忙分析一下
老大,别晕了,帮我一下呀,怎么可以解决,是什么原因引起这么大的?
作者: cell1999    时间: 2005-06-24 09:05
标题: FreeBSD的机器经常假死,帮忙分析一下
好像是隔一段时间会出现一次mbuf clusters 值很大,出现一次后只有停掉服务器几个小时,不然一直会那么大,而且web无法访问

停掉服务器几个小时后,netstat -m显示的值就比较正常了,而且好像可以连续10几个小时不再出现mbuf clusters 值很大,但只要一出现我就死了

痛苦呀,原来系统管理员是这样子生活的,我一宿没睡了,都在啃E文资料,到现在也没找到引发问题的原因 :(
作者: 剑心通明    时间: 2005-06-24 09:08
标题: FreeBSD的机器经常假死,帮忙分析一下
kern.ipc.nmbclusters可以调整用来增加系统愿意申请的网络mbuf的数量。每
个cluster(簇)大概2K的内存,所以值1024代表保留2M内核内存作为网络缓冲区。
你可以简单的计算出需要多少。如果你有一个web服务器最多可以有1000个并发
连接,每个连接吃掉16K接收和发送缓冲区,你大概需要32MB的网络缓冲区来对
付它。一个比较粗糙的方法是乘以2,所以32MBx2 = 64MB/2K = 32768。所以这
个情况下你将需要设置nmbclusters到32768。我们建议为那些内存不多的机器
设置1024到4096而4096到32768为那些有很多内存的机器。无论如何如何你不能
设置一个很随意的值,这可能导致启动时崩溃。netstat(1)的-m选项可以用来查
看网络缓冲区的使用情况。老的FreeBSD系统没有这个sysctl,所以需要设置内核
配置选项NMBCLUSTERS。
作者: cell1999    时间: 2005-06-24 10:19
标题: FreeBSD的机器经常假死,帮忙分析一下
已经在/boot/default/loader.conf里设置此值为65536,似乎没什么效果

这个问题是最近这两天才出现的,以前一直没有过,而且不是一台机器
是好几台都出现了这个问题
作者: cell1999    时间: 2005-06-24 10:25
标题: FreeBSD的机器经常假死,帮忙分析一下
apache的error_log里有几条记录

httpd in free(): error: recursive call

循环调用?

问题严重吧?
作者: cell1999    时间: 2005-06-24 10:47
标题: FreeBSD的机器经常假死,帮忙分析一下
还有一台机器netstat -m是这样的:
4294965766 mbufs in use
1175/65536 mbuf clusters in use (current/max)

上面这个值很大,下面的正常,不过是一直在变化的
这样的WEB可以访问,感觉有点怪怪的
作者: cell1999    时间: 2005-06-24 11:51
标题: FreeBSD的机器经常假死,帮忙分析一下
有没有可能是因为有人攻击?
作者: cell1999    时间: 2005-06-24 16:05
标题: FreeBSD的机器经常假死,帮忙分析一下
虾虾们,救救俺呀
作者: sanxia    时间: 2005-06-24 19:11
标题: FreeBSD的机器经常假死,帮忙分析一下
你的问题太高深了,我的水平根本帮不了你.有个建议:你先慢慢把出现问题的各种可能性都一条一条的写在笔记本上,然后一个一个的去排除,相信到了最后,你总会找到答案的.!  
^_^坐着说话不知道腰疼,我现在就是.呵呵^_^
作者: wudiyuan    时间: 2005-06-25 00:55
标题: FreeBSD的机器经常假死,帮忙分析一下
有可能是被攻击了。
作者: tonyzu2005    时间: 2005-06-27 08:39
标题: FreeBSD的机器经常假死,帮忙分析一下
估计攻击导致上级路由器阻塞。
FreeBSD没那么糟糕。才20M而已。
你可以在你的bsd上做个at 工作,ping 你的出口网关或者同一交换机内部的另外主机,看看内部是否通畅。这样在你认为bsd断网时候可以中和判断是否断网。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2