免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 1663 | 回复: 10
打印 上一主题 下一主题

请教高手关于E3500的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2004-04-28 14:33 |只看该作者 |倒序浏览
一台E3500,在/var/adm/messages中有

Apr 25 14:49:12 DB-TS.he.cn unix: ^MSunOS Release 5.7 Version Generic_106541-16 64-bit [UNIX(R) System V Release 4.0]
Apr 25 14:49:12 DB-TS.he.cn unix: Copyright (c) 1983-1999, Sun Microsystems, Inc.
Apr 25 14:49:12 DB-TS.he.cn unix: Ethernet address = 8:0:20:c9:b9:10
Apr 25 14:49:12 DB-TS.he.cn unix: WARNING: forceload of drv/atf failed
Apr 25 14:49:12 DB-TS.he.cn unix: NOTICE: DR Kernel Cage is DISABLED
Apr 25 14:49:12 DB-TS.he.cn unix: mem = 8388608K (0x200000000)
Apr 25 14:49:12 DB-TS.he.cn unix: avail mem = 8259010560

请教一下forceload of drv/atf failed是什么意思,由什么引起的?
这个DR Kernel Cage is DISABLED标是什么意思?


这个E3500共有8个CPU,其中cpu报错信息是:
WARNING: [AFT1] Uncorrectable Memory Error on CPU11 Data access at TL=0, errID 0x000083fd.a8bf2dba
WARNING: [AFT1] errID 0x000083fd.a8bf2dba Syndrome 0x3 indicates that this may not be a memory module problem
[AFT1] errID 0x000083fd.a8bf2dba UE Error(s)

用worm作负载,用vts监测了21小时无任何错误,然后将其余的都进行监测,每个都至少pass了一次。

今天发现系统自动进入ok,显示信息有:
seetop_self:return from prom_stop_self
Fast Data Access MMU Miss

请问是cpu问题还是主板问题?用什么方法可以证实一下?

在这里先谢谢了!

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
2 [报告]
发表于 2004-04-28 14:44 |只看该作者

请教高手关于E3500的问题

WARNING: [AFT1] Uncorrectable Memory Error on CPU11 Data access at TL=0, errID 0x000083fd.a8bf2dba
Fast Data Access MMU Miss

从这两条看,应该是CPU对内存访问上有问题,估计是CPU11那块板上。可以取下那块板子再继续检测一段时间。

forceload和DR信息都与此无关。

论坛徽章:
0
3 [报告]
发表于 2004-04-28 15:00 |只看该作者

请教高手关于E3500的问题

谢谢Philmoon

cpu14也报过同样的信息,我当时将其余cpu停止运行,让cpu10,cpu11,cpu14,cpu15运行,第2天发现进入ok了。

现在我停止了昨天的cpu,让没运行的再运行一天看结果。

对于这个现象我分析不出来原因(实力也不是那个档次的,呵呵),在此请各位高手不惜赐教。

论坛徽章:
7
荣誉会员
日期:2011-11-23 16:44:17水瓶座
日期:2013-08-28 21:20:16丑牛
日期:2013-10-02 21:01:462015年迎新春徽章
日期:2015-03-04 09:54:45操作系统版块每日发帖之星
日期:2016-06-05 06:20:0015-16赛季CBA联赛之吉林
日期:2016-06-20 08:24:0515-16赛季CBA联赛之四川
日期:2016-08-18 15:02:02
4 [报告]
发表于 2004-04-28 15:37 |只看该作者

请教高手关于E3500的问题

这种问题,我遇到N多,大部分不是硬件问题,而是CPU散热问题。所以建议你改善机器的散热环境。再者CPU坏一个也不会当机的,你说呢?

论坛徽章:
0
5 [报告]
发表于 2004-04-28 15:43 |只看该作者

请教高手关于E3500的问题

谢谢nimysun,cpu的散热问题我确实没有考虑到。

不过cpu发生了数据错误以至产生panic,系统会重启的。

论坛徽章:
7
荣誉会员
日期:2011-11-23 16:44:17水瓶座
日期:2013-08-28 21:20:16丑牛
日期:2013-10-02 21:01:462015年迎新春徽章
日期:2015-03-04 09:54:45操作系统版块每日发帖之星
日期:2016-06-05 06:20:0015-16赛季CBA联赛之吉林
日期:2016-06-20 08:24:0515-16赛季CBA联赛之四川
日期:2016-08-18 15:02:02
6 [报告]
发表于 2004-04-28 15:54 |只看该作者

请教高手关于E3500的问题

你查查auto-boot?参数是true or false?
我对我维护的服务器做了个比较,容易出问题的机器,CPU问题一般偏高。
正常温度在30~40度。
此外E4500这种平放着的IO板对这个灰尘是比较容易接收的,如果跑的时间太长的服务,难免会导致IO板上堆满灰尘。
而E3500就不会如此。我想E3500卖的比E4500贵的原因应该有这么一点缘故吧。
温度的查看。你可以通过这个命令得到:
/usr/platform/sun4u/sbin/prtdiag -v|more

论坛徽章:
0
7 [报告]
发表于 2004-04-28 16:16 |只看该作者

请教高手关于E3500的问题

1. 请教一下forceload of drv/atf failed是什么意思,由什么引起的?
没有关系

2。 这个DR Kernel Cage is DISABLED标是什么意思?
OS的内核分布在多个系统板上。

3。 WARNING: [AFT1] Uncorrectable Memory Error on CPU11 Data access at TL=0, errID 0x000083fd.a8bf2dba
WARNING: [AFT1] errID 0x000083fd.a8bf2dba Syndrome 0x3 indicates that this may not be a memory module problem
[AFT1] errID 0x000083fd.a8bf2dba UE Error(s)

建议升级kernel patch

论坛徽章:
0
8 [报告]
发表于 2004-04-28 16:33 |只看该作者

请教高手关于E3500的问题

nimysun,刚刚查了,最高温度是41,运行状态stable  :)

谢谢helixor,你的意思是不是硬件引起的故障,而是系统板本过低的原因吗?
记得有人说系统一旦运行起来做服务后就不要再打patch了,这样很容易导致系统崩溃,那kernel patch就是没办法打上去了,对吗?

论坛徽章:
0
9 [报告]
发表于 2004-05-09 08:14 |只看该作者

请教高手关于E3500的问题

用volume manager把root也给做备份了。你就尽管弄好了

论坛徽章:
7
荣誉会员
日期:2011-11-23 16:44:17水瓶座
日期:2013-08-28 21:20:16丑牛
日期:2013-10-02 21:01:462015年迎新春徽章
日期:2015-03-04 09:54:45操作系统版块每日发帖之星
日期:2016-06-05 06:20:0015-16赛季CBA联赛之吉林
日期:2016-06-20 08:24:0515-16赛季CBA联赛之四川
日期:2016-08-18 15:02:02
10 [报告]
发表于 2004-05-09 08:48 |只看该作者

请教高手关于E3500的问题

forceload
那是加载根分区的警告信息,不用管它,所有的系统都这样子。
软件raid嘛.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP