免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 7937 | 回复: 24
打印 上一主题 下一主题

[新手入门] 讨论:关于down机 PD,你想知道什么? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-08-07 22:13 |只看该作者 |倒序浏览
最近我想专帖整理一份“如何PD down机case”,想到的东西比较多,所以先发此帖看看大家关于如何分析宕机这个题目想知道些什么。

欢迎跟帖说明。

论坛徽章:
0
2 [报告]
发表于 2008-08-07 22:15 |只看该作者

回复 #1 yanbing 的帖子

期待啊

对dump文件的整体分析和怎样抓取相关的重点 , 主要还是方法以及思路

论坛徽章:
0
3 [报告]
发表于 2008-08-07 22:16 |只看该作者
碰到宕机,首先联想到是否是硬件问题引起的

论坛徽章:
0
4 [报告]
发表于 2008-08-07 22:17 |只看该作者
对dump的分析,分析是难点啊

论坛徽章:
0
5 [报告]
发表于 2008-08-07 23:01 |只看该作者
主要还是 如何分析的过程

软件(os app)宕机的因素要大于硬件宕机因素吧

一些误操作也有可能 不正确设置


呵呵 我感觉是这样

论坛徽章:
0
6 [报告]
发表于 2008-08-07 23:04 |只看该作者
内存消耗完,hang掉了,算不算宕机范畴啊。

论坛徽章:
0
7 [报告]
发表于 2008-08-07 23:23 |只看该作者
最好有 硬件core dump  和 软件core dump 这2个分别的PD

建议一下

论坛徽章:
0
8 [报告]
发表于 2008-08-08 08:16 |只看该作者
1.硬件引起的,遇到过cpu问题导致系统自动重启的
2.软件引起的,比如可能是应用软件或者如HACMP之类软件的配置有问题导致的
3.误操作导致down机
其他的俺想到再说......................

论坛徽章:
0
9 [报告]
发表于 2008-08-08 09:04 |只看该作者
原帖由 jimmytao 于 2008-8-8 08:16 发表
1.硬件引起的,遇到过cpu问题导致系统自动重启的
2.软件引起的,比如可能是应用软件或者如HACMP之类软件的配置有问题导致的
3.误操作导致down机
其他的俺想到再说......................


更我想的差不多啊

论坛徽章:
0
10 [报告]
发表于 2008-08-08 09:58 |只看该作者
个人感觉:
1.宕了之后起不来的,估计是硬件问题,或者微码问题.这样倒比较好解决,从硬件状态灯,asmi/sp里面都可以看到相关错误信息
2.宕了之后起来的,然后所有硬件,系统,软件 看起来都正常,这样反而比较麻烦.要看系统日志,应用日志,关键是看是宕机时间点前后发生哪些值得注意的事件,从而判断宕机偶然情况,人为操作失误,还是有什么硬伤,像上面几位提到的系统配置,软件配置等等冲突
3.抓snap分析是比较官方,也是比较让人信服的方法.但是限于水平和资源的问题,并不是每个人都有那个本事或者有途径能够拿到snap的分析结果,基本上还是靠ibm来分析.所以如果有能分析snap的方法,我想兄弟们都会很乐意学习的.
话说回来,其实,平时有固定维护的机器,很少异常宕机的
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP