忘记密码   免费注册 查看新帖 |

ChinaUnix.net

  平台 论坛 博客 文库 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
123下一页
最近访问板块 发新帖
查看: 6860 | 回复: 24

[新手入门] 讨论:关于down机 PD,你想知道什么? [复制链接]

论坛徽章:
0
发表于 2008-08-07 22:13 |显示全部楼层
最近我想专帖整理一份“如何PD down机case”,想到的东西比较多,所以先发此帖看看大家关于如何分析宕机这个题目想知道些什么。

欢迎跟帖说明。

论坛徽章:
0
发表于 2008-08-07 22:15 |显示全部楼层

回复 #1 yanbing 的帖子

期待啊

对dump文件的整体分析和怎样抓取相关的重点 , 主要还是方法以及思路

论坛徽章:
0
发表于 2008-08-07 22:16 |显示全部楼层
碰到宕机,首先联想到是否是硬件问题引起的

论坛徽章:
0
发表于 2008-08-07 22:17 |显示全部楼层
对dump的分析,分析是难点啊

论坛徽章:
0
发表于 2008-08-07 23:01 |显示全部楼层
主要还是 如何分析的过程

软件(os app)宕机的因素要大于硬件宕机因素吧

一些误操作也有可能 不正确设置


呵呵 我感觉是这样

论坛徽章:
0
发表于 2008-08-07 23:04 |显示全部楼层
内存消耗完,hang掉了,算不算宕机范畴啊。

论坛徽章:
0
发表于 2008-08-07 23:23 |显示全部楼层
最好有 硬件core dump  和 软件core dump 这2个分别的PD

建议一下

论坛徽章:
0
发表于 2008-08-08 08:16 |显示全部楼层
1.硬件引起的,遇到过cpu问题导致系统自动重启的
2.软件引起的,比如可能是应用软件或者如HACMP之类软件的配置有问题导致的
3.误操作导致down机
其他的俺想到再说......................

论坛徽章:
0
发表于 2008-08-08 09:04 |显示全部楼层
原帖由 jimmytao 于 2008-8-8 08:16 发表
1.硬件引起的,遇到过cpu问题导致系统自动重启的
2.软件引起的,比如可能是应用软件或者如HACMP之类软件的配置有问题导致的
3.误操作导致down机
其他的俺想到再说......................


更我想的差不多啊

论坛徽章:
0
发表于 2008-08-08 09:58 |显示全部楼层
个人感觉:
1.宕了之后起不来的,估计是硬件问题,或者微码问题.这样倒比较好解决,从硬件状态灯,asmi/sp里面都可以看到相关错误信息
2.宕了之后起来的,然后所有硬件,系统,软件 看起来都正常,这样反而比较麻烦.要看系统日志,应用日志,关键是看是宕机时间点前后发生哪些值得注意的事件,从而判断宕机偶然情况,人为操作失误,还是有什么硬伤,像上面几位提到的系统配置,软件配置等等冲突
3.抓snap分析是比较官方,也是比较让人信服的方法.但是限于水平和资源的问题,并不是每个人都有那个本事或者有途径能够拿到snap的分析结果,基本上还是靠ibm来分析.所以如果有能分析snap的方法,我想兄弟们都会很乐意学习的.
话说回来,其实,平时有固定维护的机器,很少异常宕机的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:wangnan@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP