免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2375 | 回复: 6

系统挂机问题 [复制链接]

论坛徽章:
0
发表于 2008-03-14 20:20 |显示全部楼层
10可用积分
最近在生产系统中经常能碰见关于系统(RHEL4U3)不稳定的问题,比如业务突然不正常,测试发现能ping通该生产机,但是telnet ip 22 (生产机开启有SSH服务,端口为22),无任何反应,说明系统并没有监听该服务。因为不在现场,无法进行实际的判断,目前出现该问题的解决方法是重启服务器后即可恢复正常。
不知出现该问题是否应该叫做操作系统挂起那?但是ping能正常相应,说明至少在网络层上是没有问题的。我想问下有没有什么好的处理方法或者DEBUG来测试出现该问题的具体原因,先谢谢CU的兄弟了。

最佳答案

查看完整内容

首先声明一点,只要能够ping通系统,证明系统没有挂起。我所说的挂起实际上指的就是死机,在这种时候所有的交互,服务,应用,包括系统日志和内核日志都统统完蛋,因为这些都是基于操作系统的服务。往往这个时候RHEL系统中通常有一种叫做watchdog的功能,该功能由内核控制,只要在一定时候收不到内核存活信号,他就会在屏幕上打一大堆的call trace信息,之后立即重启系统。但假如预先没有这种watchdog功能开启的话,系统会在屏幕上 ...

论坛徽章:
0
发表于 2008-03-14 20:20 |显示全部楼层
最近在生产系统中经常能碰见关于系统(RHEL4U3)不稳定的问题,比如业务突然不正常,测试发现能ping通该生产机,但是telnet ip 22 (生产机开启有SSH服务,端口为22),无任何反应,说明系统并没有监听该服务。因为不在现场,无法进行实际的判断,目前出现该问题的解决方法是重启服务器后即可恢复正常。
不知出现该问题是否应该叫做操作系统挂起那?但是ping能正常相应,说明至少在网络层上是没有问题的。我想问下有没有什么好的处理方法或者DEBUG来测试出现该问题的具体原因,先谢谢CU的兄弟了。


首先声明一点,只要能够ping通系统,证明系统没有挂起。我所说的挂起实际上指的就是死机,在这种时候所有的交互,服务,应用,包括系统日志和内核日志都统统完蛋,因为这些都是基于操作系统的服务。
往往这个时候RHEL系统中通常有一种叫做watchdog的功能,该功能由内核控制,只要在一定时候收不到内核存活信号,他就会在屏幕上打一大堆的call trace信息,之后立即重启系统。但假如预先没有这种watchdog功能开启的话,系统会在屏幕上显示一大堆的报错信息然后死在那里。
因此上面的这种情况,叫做挂起,或者叫hang。
对于上面这种情况,处理起来相对比较容易。


但是像你所说的,如果系统能够回应ping,只不过服务中断和异常,交互没有反应。但就是因为能够回应ping包,所以证明系统其实没有hang,这种情况叫做dead lock。
这样的情况是最麻烦的。因为已经根本没有办法对系统进行控制,也无法拿出日志或者debug来获得系统出现异常的原因。

论坛徽章:
0
发表于 2008-03-14 21:27 |显示全部楼层
你试一试吧防火墙停止了看看。

论坛徽章:
0
发表于 2008-03-14 21:31 |显示全部楼层
1.如果在内网是不是路由器封锁了22(我遇见过此情况)
2.查一下系统日志看看哪的问题
3写一脚本不段检查服务是否正常提供,如果否,着启动服务

论坛徽章:
0
发表于 2008-03-14 22:12 |显示全部楼层
之所以说hang这种情况比较容易对付,是因为可以通过一种叫做netdump服务在当前系统hang的时候把他内存中的所有参数抓出来,放到另外一台叫做netdump server的服务器上,该服务器的作用就是监控可能死机的服务器并在他死机的时候获得他的内存信息,这个东西叫做dump core;而被监控的这台机器就叫做netdump client。当然每次抓出来的东西会根据你的client内存大小不同而不同,如果你的client有16G内存,搞不好你抓出来的dump core得用好几张DVD来放,抓出来的dump core可以提供给RED HAT高级工程师用于分析和查找系统死机原因。

当然前提是你必须购买两套以上的RHEL订阅,并处于订阅服务期内,一般情况下都能够获得系统死机的真正原因。不过你要有足够自信的话也可以自己去看,反正我是看不懂。

这应该就是RHEL比windows好的地方。

论坛徽章:
0
发表于 2008-03-14 22:13 |显示全部楼层
但假如说是dead lock,对不起,只能等待系统重启之后去分析日志了。

论坛徽章:
0
发表于 2008-03-14 22:45 |显示全部楼层
感觉应该是dead lock
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP