免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 31907 | 回复: 76
打印 上一主题 下一主题

RHEL5.4 (固定时间间隔)无故死机 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-05-11 10:37 |只看该作者 |倒序浏览
大家好,最近2个月试用了redhat enterprise server 5.4 x86_64系统,安装了oracle11。

硬件是: HP DL580 G7  内存128G  

问题: 每隔几天系统就死机,时间很固定的(查看了cron任务,没有异常任务),而且没有生成任何日志,故无法排查问题所在。

请教各位有经验的TX,如此情况下,如何进行问题排查?  谢谢!

论坛徽章:
381
CU十二周年纪念徽章
日期:2014-01-04 22:46:58CU大牛徽章
日期:2013-03-13 15:32:35CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55CU大牛徽章
日期:2013-04-17 11:17:19CU大牛徽章
日期:2013-04-17 11:17:32CU大牛徽章
日期:2013-04-17 11:17:37CU大牛徽章
日期:2013-04-17 11:17:42CU大牛徽章
日期:2013-04-17 11:17:47CU大牛徽章
日期:2013-04-17 11:17:52CU大牛徽章
日期:2013-04-17 11:17:56
2 [报告]
发表于 2011-05-11 10:50 |只看该作者
系统彻底崩溃了?

论坛徽章:
0
3 [报告]
发表于 2011-05-11 11:02 |只看该作者
就是无任何响应了,ping不通,ssh也不通, 直接用键盘也不行,显示器也是黑屏的。

论坛徽章:
0
4 [报告]
发表于 2011-05-11 13:57 |只看该作者
看看/var/log/messages有无报错信息。
用smartcd启动进入诊断程序看看,有无硬件错误。

论坛徽章:
0
5 [报告]
发表于 2011-05-11 15:49 |只看该作者
本帖最后由 tener 于 2011-05-11 15:57 编辑

/var/log/messages中看不到出了oracle信息之外的任何错误信息,而从/var/log/boot.log中也看不到启动的任何错误信息。

主要是死机时间台怪异了,非常之固定,比如5天前的15:30分系统重启了,那么,在今天的15:30分左右,必死。 无解了。

论坛徽章:
0
6 [报告]
发表于 2011-05-11 16:12 |只看该作者
回复 5# tener


    那就找出这个时间点的日志里写的什么 ?     或者看这个时间点有类似cron任务没!    其它日志也看看吧 !  

    如果硬件问题的话 这时间也太固定了!

论坛徽章:
381
CU十二周年纪念徽章
日期:2014-01-04 22:46:58CU大牛徽章
日期:2013-03-13 15:32:35CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55CU大牛徽章
日期:2013-04-17 11:17:19CU大牛徽章
日期:2013-04-17 11:17:32CU大牛徽章
日期:2013-04-17 11:17:37CU大牛徽章
日期:2013-04-17 11:17:42CU大牛徽章
日期:2013-04-17 11:17:47CU大牛徽章
日期:2013-04-17 11:17:52CU大牛徽章
日期:2013-04-17 11:17:56
7 [报告]
发表于 2011-05-11 16:40 |只看该作者
固定时间出问题,应该不是硬件故障

论坛徽章:
0
8 [报告]
发表于 2011-05-11 17:00 |只看该作者
crond先关上看看呢,上点log吧

论坛徽章:
0
9 [报告]
发表于 2011-05-11 22:55 |只看该作者
有没有可能是oracle的计划任务而不是系统的计划任务?

如果你能提供几个/var/log/sa下的sar文件,以及messages文件,倒是可以看看。

论坛徽章:
0
10 [报告]
发表于 2011-05-11 22:58 |只看该作者
/var/log/messages中无任何错误信息(除了oracle的RAC之间的同步问题之外),而配置了kdump都抓不到vmcore信息的。

这个问题比较的棘手,今天再次出问题了,仍然无法找到问题。

关于crontab,在机器down机的时候,无任何任务运行,后来才加的输出各种top、ping重定向日志,但是看到top的比较,基本没有区别。

到现在位置,还不能判断是系统原因? 还是硬件原因? 更或者是oracle的原因?


只能继续集思广益吧,先谢谢楼上各位TX的回复。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP