免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5744 | 回复: 6
打印 上一主题 下一主题

[求助] hp自动关机--Voltage degraded to non-recoverable level [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-12-13 23:30 |只看该作者 |倒序浏览

hp 安腾 rx2660 运行过程自动关机了,查了下MP卡日志,如下。 请大侠们帮忙看看什么原因? 出现问题自动关机后,手动重启下,目前运行正常。

从日志看貌似CPU有问题,是否需要更换CPU? 虽然重启后正常运行,还是否有风险。。请各位大侠指点,多谢~~

(日志如下,凌晨4点多出问题,8点半左右重启)


MP:SL (+,-,<CR>,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >


Log Entry 116: 13 Dec 2012 04:45:01
Alert Level 2: Informational
Keyword: POWER_UNIT_DISABLED
Power unit disabled
Logged by: Baseboard Management Controller;
Sensor: Power Unit - Power Control
Data1: Device Disabled
0x2050C95D4D020970 FFFF000943090300


Log Entry 115: 13 Dec 2012 04:45:00
Alert Level 2: Informational
Keyword: CHASSIS_CONTROL_REQUEST
Chassis Control request to BMC via IPMI or sensor
Logged by: Baseboard Management Controller;
Sensor: System Event - Proc 0 Power
Data2: OEM Code2: 0xD0
0x2050C95D4C020960 D000A370D0120300


MP:SL (+,-,<CR>,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >



Log Entry 114: 13 Dec 2012 04:45:00
Alert Level 7: Fatal
Keyword: SHUTDOWN_OR_RESET_ON_SENSOR
System shut down or reset caused by sensor reading
Logged by: Baseboard Management Controller;
Sensor: System Event - Proc 0 Power
Data2: OEM Code2: 0xD0
0x2050C95D4C020950 D000A870D0120300


Log Entry 113: 13 Dec 2012 04:44:59
Alert Level 5: Critical
Keyword: VOLTAGE_DEGRADES_TO_NON_RECOVERABLE
Voltage degraded to non-recoverable level - Check all boards with this voltage.
Logged by: Baseboard Management Controller;
Sensor: Voltage - Proc 0 Power
Data1: transition to Non-recoverable from less severe
0x2050C95D4B020940 FFFF0307D0020300



MP:SL (+,-,<CR>,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >t
MP:SL (+,-,<CR>,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >



Log Entry 124: 13 Dec 2012 08:31:53
Alert Level 2: Informational
Keyword: BOOT_FINISHED
OS Boot complete.
Logged by: OS Software Agent;
Sensor: OS Boot
Data1: boot completed-boot device not specified
0x2150C99279020A10 FF0F066F001F0300


Log Entry 123: 13 Dec 2012 08:30:38
Alert Level 2: Informational
Keyword: BOOT_SWITCH_INSECURE_MODE
System has been switched to insecure mode
Logged by: System Firmware  0
Data: Data field unused
0x40801CBB00E009F0 0000000000000000


MP:SL (+,-,<CR>,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >



Log Entry 122: 13 Dec 2012 08:30:21
Alert Level 2: Informational
Keyword: BOOT_START
CPU starting boot
Logged by: System Firmware  0
Data: Major change in system state
0x5480006300E009D0 0000000000000000


Log Entry 121: 13 Dec 2012 08:30:21
Alert Level 2: Informational
Keyword: CPU_START_BOOT
CPU starting boot
Logged by: Redundant w/ an E0 code;
Sensor: System Boot Initiated
Data1: transition to Running
0xC150C9921D0209C0 FFFF000A001D0300


MP:SL (+,-,<CR>,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >



Log Entry 120: 13 Dec 2012 08:30:10
Alert Level 2: Informational
Keyword: POWER_UNIT_ENABLED
Power unit enabled
Logged by: Baseboard Management Controller;
Sensor: Power Unit - Power Control
Data1: Device Enabled
0x2050C992120209B0 FFFF010943090300


Log Entry 119: 13 Dec 2012 08:30:10
Alert Level 2: Informational
Keyword: ACPI_ON
ACPI state S0 (on)
Logged by: Baseboard Management Controller;
Sensor: System ACPI Power State - ACPI Power State
Data1: S0/G0 working
0x2050C992120209A0 FFFF006FFA220300


MP:SL (+,-,<CR>,D, F, L, J, H, K, T, A, U, ? for Help, Q or Ctrl-B to Quit) >



Log Entry 118: 13 Dec 2012 08:30:09
Alert Level 2: Informational
Keyword: SOFT_RESET
Soft Reset
Logged by: Baseboard Management Controller;
Sensor: System Event
0x2050C99211020990 FFFF027000120300


Log Entry 117: 13 Dec 2012 08:30:01
Alert Level 2: Informational
Keyword: CHASSIS_CONTROL_REQUEST
Chassis Control request to BMC via IPMI or sensor
Logged by: Baseboard Management Controller;
Sensor: System Event
Data2: OEM Code2: 0x01
0x2050C99209020980 0181A37000120300

113   BMC     *5  0x2050C95D4B020940 FFFF0307D0020300 VOLTAGE_DEGRADES_TO_NON_RECOVERABLE
                                                      13 Dec 2012 04:44:59
114   BMC     *7  0x2050C95D4C020950 D000A870D0120300 SHUTDOWN_OR_RESET_ON_SENSOR
                                                      13 Dec 2012 04:45:00
115   BMC      2  0x2050C95D4C020960 D000A370D0120300 CHASSIS_CONTROL_REQUEST
                                                      13 Dec 2012 04:45:00
116   BMC      2  0x2050C95D4D020970 FFFF000943090300 POWER_UNIT_DISABLED
                                                      13 Dec 2012 04:45:01

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
2 [报告]
发表于 2012-12-14 14:27 |只看该作者
问题点在CPU0的电源供电上,如果在保就更换备件(忘了这一款的CPU电源供电部分是在CPU的FRU上还是在系统底板上的,跟HP的确认一下吧)。不在保的话就再观察一下,如果出现同样问题,报错的地方也一样,那还是需要更换备件。
Log Entry 113: 13 Dec 2012 04:44:59
Alert Level 5: Critical
Keyword: VOLTAGE_DEGRADES_TO_NON_RECOVERABLE
Voltage degraded to non-recoverable level - Check all boards with this voltage.
Logged by: Baseboard Management Controller;
Sensor: Voltage - Proc 0 Power     ==> 故障点
Data1: transition to Non-recoverable from less severe
0x2050C95D4B020940 FFFF0307D0020300

论坛徽章:
0
3 [报告]
发表于 2012-12-14 21:38 |只看该作者
现在已经过保了,因为这个容灾平台上的机器,不是生产平台的机器,所以目前系统能够运行,就暂时不想浪费备件(备件有限)。

但是如果不换的话,又怕这个CPU电源有问题,或者说CPU的供电不稳定之类的,会不会连带损坏其他部件。有点担心造成其他连带损坏,所以有点纠结换还是不换~

:-(

回复 2# lbseraph


   

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
4 [报告]
发表于 2012-12-15 00:03 |只看该作者
供电不足的话还好,基本不会导致其他备件故障;如果过压的话就有可能会烧其他东西,如果你那有电气工程师问一下就知道了。

论坛徽章:
5
CU大牛徽章
日期:2013-09-18 15:16:55CU大牛徽章
日期:2013-09-18 15:18:22CU大牛徽章
日期:2013-09-18 15:18:432015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:45
5 [报告]
发表于 2012-12-15 17:52 |只看该作者
lbseraph 发表于 2012-12-14 14:27
问题点在CPU0的电源供电上,如果在保就更换备件(忘了这一款的CPU电源供电部分是在CPU的FRU上还是在系统底板 ...


CPU供电部分应该都和CPU在一起的吧,主板上接出来的电缆看着很简单

论坛徽章:
0
6 [报告]
发表于 2012-12-17 22:41 |只看该作者

这边没有相关的专业人士,都是搞业务的兼职硬件部分。

那就先观察一段时间看看再说,如果再次出现问题就换CPU. 另外问了下,这款小型机的CPU供电部分在CPU上,没在主版本上。

多谢斑竹这几天耐心解答 ~~~

回复 4# lbseraph


   

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
7 [报告]
发表于 2012-12-18 09:09 |只看该作者
vincent850214 发表于 2012-12-17 22:41
这边没有相关的专业人士,都是搞业务的兼职硬件部分。
...


中小企业貌似都这样,让SA也做硬件部分,大点的会把应用、系统、硬件部分都分开的。谢谢回复~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP