免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7542 | 回复: 18
打印 上一主题 下一主题

[求助] rx6600 HP-UX_OS_CRITICAL_SHUTDOWN(已补充所有log) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-12-29 00:38 |只看该作者 |正序浏览
本帖最后由 alpha4000 于 2013-01-02 23:03 编辑

rx6600,v11.31,系统上周才重启过,uptime显示为7天,今天eventlog出现如下错误(请忽略主机名、ip等信息):

>------------ Event Monitoring Service Event Notification ------------<

Notification Time: Fri Dec 28 20:59:46 2012

node1_1 sent Event Monitor notification information:

/system/events/ipmi_fpl/ipmi_fpl is >= 1.
Its current value is INFORMATION(1).

Event data from monitor:

Event Time..........: Fri Dec 28 20:59:46 2012
Severity............: INFORMATION
Monitor.............: fpl_em
Event #.............: 4552               
System..............: node1_1

Summary:
     INIT initiated

Description of Error:

This is the equivalent of a TOC event in the PA RISC Architecture. On IPF
systems, this event is called an INIT.
This event can be triggered by the "tc" command from the MP, or from the button
labeled "TOC" or "Transfer of Control" on the Management card or bezel of the
system. There are also other causes of an INIT generated by software.
Data: Local CPU Number

Probable Cause / Recommended Action:

Software has requested an INIT or the INIT button has been pressed.
No action is required.

Additional Event Data:
     System IP Address...: 100.xx.xx.xx
     System IP Address...: 10.xx.xx.xx
     System IP Address...: 127.0.0.1
     Event Id............: 0x50dd97c200000000
     Monitor Version.....: A.01.00
     Event Class.........: System
     Client Configuration File...........:
     /var/stm/config/tools/monitor/default_fpl_em.clcfg
     Client Configuration File Version...: A.01.00
          Qualification criteria met.
               Number of events..: 1
     Associated OS error log entry id(s):
          None
     Additional System Data:
          System Model Number.............: ia64 hp server rx6600
          EMS Version.....................: A.04.20.31.02
          STM Version.....................: D.04.00
          System Serial Number............: SGHxxxxx
     Latest information on this event:
          http://docs.hp.com/hpux/content/hardware/ems/fpl_em.htm#4552

v-v-v-v-v-v-v-v-v-v-v-v-v    D  E  T  A  I  L  S    v-v-v-v-v-v-v-v-v-v-v-v-v


IPMI event hex: 0xf480007900e00360 000000000000000000
Time Stamp: Thu Dec 15 05:37:09 2011
Event keyword: INIT_INITIATED
Alert level name: Fatal
Reporting vers: 1
Data field type: Major change in system state
Decoded data field: System State       =   0(Boot Start)
State Change Event =   0(At BIB)
LED Command Valid  =   0(LED state is not updated)
LED Run            =   0(off (default))
LED Attention      =   0(reserved)
LED Stopped        =   0(off (default))
Reporting entity ID: 0 ( Cab 0 Cell 0 CPU 0 )
Reporting entity Full Name: System Firmware
IPMI Event ID : 121 (0x79)


>---------- End Event Monitoring Service Event Notification ----------<

>------------ Event Monitoring Service Event Notification ------------<

Notification Time: Fri Dec 28 20:59:46 2012

node1_1 sent Event Monitor notification information:

/system/events/ipmi_fpl/ipmi_fpl is >= 1.
Its current value is CRITICAL(5).

Event data from monitor:

Event Time..........: Fri Dec 28 20:59:46 2012
Severity............: CRITICAL
Monitor.............: fpl_em
Event #.............: 6772               
System..............: node1_1

Summary:
     HP-UX OS shutdown due to an MCA or INIT

Description of Error:

An OS is shutting down due to an MCA (Machine Check Abort) or INIT.

Probable Cause / Recommended Action:

An MCA or INIT occurred.
Analyze the dump & logs for cause. If necessary contact HP Support for
assistance.

Additional Event Data:
     System IP Address...: 100.xx.xx.xx
     System IP Address...: 10.xx.xx.xx
     System IP Address...: 127.0.0.1
     Event Id............: 0x50dd97c200000002
     Monitor Version.....: A.01.00
     Event Class.........: System
     Client Configuration File...........:
     /var/stm/config/tools/monitor/default_fpl_em.clcfg
     Client Configuration File Version...: A.01.00
          Qualification criteria met.
               Number of events..: 1
     Associated OS error log entry id(s):
          None
     Additional System Data:
          System Model Number.............: ia64 hp server rx6600
          EMS Version.....................: A.04.20.31.02
          STM Version.....................: D.04.00
          System Serial Number............: SGHxxxxxxx
     Latest information on this event:
          http://docs.hp.com/hpux/content/hardware/ems/fpl_em.htm#6772

v-v-v-v-v-v-v-v-v-v-v-v-v    D  E  T  A  I  L  S    v-v-v-v-v-v-v-v-v-v-v-v-v


IPMI event hex: 0xf4801c3100e00410 0x000000000019100c
Time Stamp: Thu Dec 15 05:37:12 2011
Event keyword: HP-UX_OS_CRITICAL_SHUTDOWN
Alert level name: Fatal
Reporting vers:

Data field type: Major change in system state
Decoded data field: System State       =  12(State Change)
State Change Event =  25(Reserved)
LED Command Valid  =   0(LED state is not updated)
LED Run            =   0(off (default))
LED Attention      =   0(reserved)
LED Stopped        =   0(off (default))
Reporting entity ID: 0 ( Cab 0 Cell 0 CPU 0 )
Reporting entity Full Name: HP-UX Kernel
IPMI Event ID : 7217 (0x1c31)

>---------- End Event Monitoring Service Event Notification ----------<

实在无从着手,是不是需要安装什么补丁啊?

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
19 [报告]
发表于 2013-01-07 13:53 |只看该作者
那个可以找HP看一下的,如果你想看的话~他们有工具看那种日志。

论坛徽章:
0
18 [报告]
发表于 2013-01-07 00:41 |只看该作者
lbseraph 发表于 2013-01-05 16:50
奇怪,确实没有~还有个地方可以看眼,目录/var/stm/logs/os下面有fpl.log.xxx这些文件,不过要用命令或工具 ...


我用getsysinfo抓了,看见有几个fpl.log.xx.old的文件
看不了,暂时就这样了

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
17 [报告]
发表于 2013-01-05 16:50 |只看该作者
奇怪,确实没有~还有个地方可以看眼,目录/var/stm/logs/os下面有fpl.log.xxx这些文件,不过要用命令或工具才能看的~

论坛徽章:
0
16 [报告]
发表于 2013-01-04 16:29 |只看该作者
lbseraph 发表于 2013-01-04 16:13
MP里面的SEL没有更老的日志了?在之前是否更改过MP的时间?


时间我没有改过
版主我把mp的sel日志上传了 2012-12-31__mp.rar (2.47 KB, 下载次数: 9)

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
15 [报告]
发表于 2013-01-04 16:13 |只看该作者
MP里面的SEL没有更老的日志了?在之前是否更改过MP的时间?

论坛徽章:
0
14 [报告]
发表于 2013-01-04 10:24 |只看该作者
lbseraph 发表于 2013-01-03 20:26
MP里面应该有下面这个event吧?这种就是MP里面同步到系统event.log里面的~


谢谢版主

根据你的建议
1、我现在在mp的sel里面,12月份里面第一个信息就是我们那晚(21日凌晨,时间稍有误差,但是还没差过一天)做切换演练的,这里是手工reboot的
Log Entry 65: 20 Dec 2012 16:07:47
Alert Level 2: Informational
Keyword: HP-UX_OS_NORMAL_SHUTDOWN
HP-UX OS normal shutdown.
Logged by: HP-UX Kernel 0
Data: Major change in system state - State Change
0x54801C3000E005F0 00000000001A100C

Log Entry 67: 20 Dec 2012 16:08:08
Alert Level 2: Informational
Keyword: CPU_START_BOOT
CPU starting boot
Logged by: Redundant w/ an E0 code;
Sensor: System Boot Initiated
Data1: transition to Running
0xC150D337E8020620 FFFF000A001D0300

2、现在crash下面确实是空的

现在业务无异常,我准备继续观察看看了

多谢版主的耐心回复

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
13 [报告]
发表于 2013-01-03 20:26 |只看该作者
MP里面应该有下面这个event吧?这种就是MP里面同步到系统event.log里面的~
IPMI event hex: 0xf480007900e00360 000000000000000000
Time Stamp: Thu Dec 15 05:37:09 2011
Event keyword: INIT_INITIATED


你说的init 6是Linux里面的重启吧?不一样的,这里IA64的INIT动作相当于PA-RISC中的TOC动作,如果做这个动作的话,系统会强制重启并同时把内存的内容dump下来保存到本地硬盘(HP-UX对应的默认目录就是/var/adm/crash)供分析的。

论坛徽章:
0
12 [报告]
发表于 2013-01-03 13:56 |只看该作者
lbseraph 发表于 2013-01-03 07:11
第一个event已经告诉你了,是12月15日做了INIT导致的。Details里面有时间~


看了syslog及mp的sel都没看到12月15日对应时间有什么记录
版主所说的init操作,是执行init 6类似这种操作吗?

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
11 [报告]
发表于 2013-01-03 07:11 |只看该作者
第一个event已经告诉你了,是12月15日做了INIT导致的。Details里面有时间~

IPMI event hex: 0xf480007900e00360 000000000000000000
Time Stamp: Thu Dec 15 05:37:09 2011
Event keyword: INIT_INITIATED
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP