513964839 发表于 2014-04-29 17:56

【硬件故障】请判断是否是CPU故障

【环境介绍】
物理服务器型号: HP ProLiant DL580 G4
出厂日期: 06/10/2008
当前日期: 2014-04-29
CPU配置:4颗16核,Intel(R) Xeon(TM) CPU 2.60GHz
内存: 1G×16
硬盘:

【现象】
系统的/var/log/message:
Apr 29 07:04:27 cdnlxlongjh92 kernel: : Machine check events logged
Apr 29 07:51:57 cdnlxlongjh92 kernel: : Machine check events logged

mcelog命令的输出日志:
Hardware event. This is not a software error.
MCE 0
CPU 15 BANK 0
MISC 10000838002a0 ADDR 42fa94080
TIME 1398726267 Tue Apr 29 07:04:27 2014
MCG status:
MCi status:
Corrected error
MCi_MISC register valid
MCi_ADDR register valid
MCA: Generic CACHE Level-1 Snoop Error
MISC format 0 value 10000838002a0
STATUS 8c00000020040189 MCGSTATUS 0
MCGCAP 180a05 APICID b SOCKETID 2
CPUID Vendor Intel Family 15 Model 6


【问题】
结合上述日志,是否可以认为是这个服务器的CPU存在问题?
谢谢。

q1208c 发表于 2014-04-30 08:03

象是内存的错, 看下面说 Corrected Error, 可能是 ECC 给纠正了.

最后配置检查一下 iLO 的日志看看

513964839 发表于 2014-05-22 15:21

回复 2# q1208c
谢谢,已经让对方换服务器了。没有ILO权限。

   

lbseraph 发表于 2014-05-24 23:11

这种肯定是硬件问题的~报错也明摆告诉你了~

513964839 发表于 2014-07-16 11:32

回复 4# lbseraph


    是的,谢谢哈~~

linayzc 发表于 2014-07-16 12:21

看一眼 前面板 报错指示灯
页: [1]
查看完整版本: 【硬件故障】请判断是否是CPU故障