免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2565 | 回复: 3
打印 上一主题 下一主题

服务器无故死机 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-01-29 15:34 |只看该作者 |倒序浏览
本帖最后由 windbadboy 于 2013-01-29 15:35 编辑

机型:DELL R710
OS:CENT 6.0 X64
机器主要做BT资源服务器,连接数高峰时期不到1000个,流量吞吐率100来M,有6块SAS 1T磁盘,IO也不高。
问题:服务器运行10多天就会出现DOWN机情况,接显示器无任何响应,只能重启;
已使用手段:
1、更新了最新的BROADCOM网卡驱动,问题依然;
2、查看/var/log/messages日志,没看出异常,只查到服务器无响应后,没有新日志生成,证明系统完全挂了。
3、如果不跑服务,服务器不会DOWN机。
请问还有没有什么方法查找到死机的原因?

论坛徽章:
0
2 [报告]
发表于 2013-01-30 09:54 |只看该作者
在/proc/interrupts下查看系统的中断MCE的终端数量是否为0,如果不是0那就说明是有个MCE发生,参考一下/var/log/mcelog中内容或许会有帮助。

论坛徽章:
0
3 [报告]
发表于 2013-01-30 19:50 |只看该作者
先升级到CENTOS6.3再说。

论坛徽章:
0
4 [报告]
发表于 2013-02-27 13:27 |只看该作者
本帖最后由 启胧数据 于 2013-02-27 13:27 编辑

1、BROADCOM网卡有一项功能是 空闲自动断网功能,不过基于死机状态,应该不是该功能影响的
2、服务器无故死机多出现在配有raid的服务器中,假如在存储过程中raid功能出现问题,也可引发服务器无故down机
3、检查服务器的硬盘接线和插拔内存,因服务器长期运作,所以可能造成某些硬件接触不良
4、如果以上方法都不能解决,建议关闭raid功能,观察是否还会down机,如果依旧宕机,那可能是硬盘存在问题。
启胧数据cn-p.com
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP