免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: kentao
打印 上一主题 下一主题

[小机硬件] p550有一半内存找不到(已解决) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-06-10 19:35 |显示全部楼层 |倒序浏览
p550,4C,32G内存,16*2G每条

但是系统只能看到16G,另外16G找不到,用lscfg可以看到16条2G的内存,另外一台机器(与这台机器做成了群集,一起买的)没有问题。

errpt也没有内存报错

这会是咋回事?谢谢!

[ 本帖最后由 kentao 于 2009-6-26 08:29 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2009-06-11 16:51 |显示全部楼层
ASMI中确实有一半内存被deconfig了,Error Type:By association E8,啥意思?

并且在ASMI的日志中没有找到内存报错的信息,我想不可能8条内存都有问题了吧?

下一步我该怎么处理或怎么测试?(机器过保了)

谢谢!

论坛徽章:
0
3 [报告]
发表于 2009-06-12 10:06 |显示全部楼层
原帖由 我老婆黑社会 于 2009-6-11 19:08 发表


association 是被其他错误导致被deconfig的。

还有啊,你求帮助能不能收集点信息,就凭口说。
把 deconfig信息,event log,都贴出来看看啊,你 让我们来猜啊



谢谢!

deconfig就是那个E8的报错信息,events log没有跟内存相关的,所以没有贴出来。

events log中有电源报错,原来主机异常掉过电,是否会引起内存丢失,那这样是否是内存并没有坏,直接通过celogin激活就可以?

论坛徽章:
0
4 [报告]
发表于 2009-06-13 12:09 |显示全部楼层
原帖由 我老婆黑社会 于 2009-6-12 12:11 发表
你确定所有deconfig内存都是
deconfig了,Error Type:By association E8
这个状态?

有没有这种:
Error Type:Diagnostic (E3)

没有的话,你确定没其他硬件报错,就celogin清除deconfig信息就可以了



谢谢!

没有其他报错,都是E8

但是机器过保了,怎么搞到celogin的口令啊?

一半内存找不到,我用另一半好的内存换掉这些坏的内存,是否能判断是否是内存问题还是内存插槽问题?这样做可以吗?或者说将好内存与deconfig掉的内存互换,能否解决问题?

论坛徽章:
0
5 [报告]
发表于 2009-06-17 23:02 |显示全部楼层
最新进展:

由于我原来机器的微码比较老,好像是SF235_209的,很多信息都报不出来。今天有停机的机会,把机器微码升级成SF240_358

升级完微码后,有些新信息报出来了,请大家帮忙看一下:

图片中的“Unit 0:Controler”和“Unit 2、3:Buffer”都被Deconfig了,但是Unit 0是Unrecoverable E2,是不是内存板坏了?

谢谢!

[ 本帖最后由 kentao 于 2009-6-17 23:05 编辑 ]

Deconfig Info.JPG (225.93 KB, 下载次数: 83)

Deconfig Info.JPG

论坛徽章:
0
6 [报告]
发表于 2009-06-18 10:25 |显示全部楼层
谢谢!

CPU没有被Deconfig。

换CPU板是不是连CPU都要一起换?

论坛徽章:
0
7 [报告]
发表于 2009-06-26 08:42 |显示全部楼层
感谢各位的帮助,现在这个问题已经解决,分享一下:

1、找了8条2GB的内存备件,但是没用上

2、我开始一直怀疑这个问题是不是由IBM P550的那个CPU BUG引起的,9113的CPU设计的那个散热片很重,长时间后,会将下面的CPU压坏。IBM早些时候在免费为这些机器加一个CPU的夹子,把那个散热片托起来,我们这里因为停机困难,一直没搞。

3、这次停机后,仔细看了一下CPU,发现CPU的那些引脚都被压弯了。

4、将两个CPU的内存互换了一下,重启后,在ASMI中发现除了UNIT 0外,其他的都变成config了,Unit 0还是Unrecoverable E2

5、试图使用admin用户将UNIT 0改成config,SAVE,不成功。

6、找IBM的一个朋友申请了一个celogin的密码,激活这个UNIT 0,成功,不过还要继续观察。

这次故障:内存没坏,CPU也没坏,判断估计还是因为9113 CPU的那个BUG引起的,下次停机的时候找IBM搞个架子过来,把那个散热片撑起来。我还有一堆的p550机器,估计都要加那个CPU架子,晕!

论坛徽章:
0
8 [报告]
发表于 2009-07-02 10:57 |显示全部楼层
原帖由 我老婆黑社会 于 2009-7-1 18:47 发表

  强制清除deconfig信息,激活硬件会出问题的,被deconfig肯定是有硬件问题的,不更换硬件直接激活,迟早还会down



高!

观察了两天后,发现有1条内存被Deconfig了,这次不是一半内存找不到,只有一条,换了暂时也没事了!

论坛徽章:
0
9 [报告]
发表于 2011-02-24 17:22 |显示全部楼层
回复 36# suibian102


    没想到这个帖子这么久了还有人看!

  ASMI截图?

  用笔记本接到服务器上,打开ASMI,然后。。。。。。截图!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP