jianfa777911 发表于 2009-07-06 20:01

RX4640 MP卡的日志可以判断是哪根内存有错嘛?

因为用cstm的map没办法抓出memory这个项目,请各位哥们帮个忙看看···:)

Log Entry 893: 02 Jul 2009 15:36:07
Alert Level 2: Informational
Keyword: MEM_CORR_ERR
Correctable (single-bit) ECC error in DIMM
Logged by: System Firmware0
Data: Location - Memory (SIMM or DIMM): DIMM Slot 0x1A, Extender 0
0x448000A700E03ED0 FFFFFFFF001AFF74

Log Entry 892: 02 Jul 2009 15:36:07
Alert Level 2: Informational
Keyword: Type-02 0c7000 815104
ECC error corrected in memory module
Logged by: Redundant w/ an E0 code;
         Sensor: Memory
Data2: PRV State: 0x8FOEM Code2: 0x0B
0xC14A4CD3E7023EC0 0B8F6070A00C0300

五“宅”一生 发表于 2009-07-06 20:47

cstm的map里面没有memory吗?

jianfa777911 发表于 2009-07-06 21:28

我这是两台做集群,在另一台用cstm可以抓取到memory,但是有内存故障的这一台抓不出来。不知道是否还有其它的方法可以抓memory的吗?使用stm也是一样的。

leelangco 发表于 2009-07-06 21:57

DIMM Slot 0x1A

[ 本帖最后由 leelangco 于 2009-7-6 22:08 编辑 ]

jianfa777911 发表于 2009-07-06 22:08

我知道的是0A 0B 0C 0D 为一组, 1A 1B 1C 1D 为一组,这样的话应该是哪一条呢?

jianfa777911 发表于 2009-07-06 22:11

slot 0 是什么意思呢?

easybegin 发表于 2009-07-07 09:23

学习一下

gcgsuper 发表于 2009-07-07 09:43

ECC error corrected in memory module
Logged by: Redundant w/ an E0 code;
         Sensor: Memory
Data2: PRV State: 0x8FOEM Code2: 0x0B
0xC14A4CD3E7023EC0 0B8F6070A00C0300


应该是0B哦:em03:

gaoshixing 发表于 2009-07-07 10:09

cstm为什么抓不到?
你试试这样
cstm
cstm>map
cstm>sel dev all
cstm>info
cstm>il

hbh231 发表于 2009-07-07 13:04

如果内存坏了,那一组内存就被隔离了,cstm看不到的。

MP的log已经说的很清楚了,故障内存是1A和0B。

其实这种报错不一定是内存的问题,我已经遇到2次这样的报错了,把报错的内存和同组的好内存交换插下就OK了。

可以先试着交换内存插下,记得把内存编下号,免的搞错了。
页: [1] 2
查看完整版本: RX4640 MP卡的日志可以判断是哪根内存有错嘛?