免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3777 | 回复: 8
打印 上一主题 下一主题

帮忙看一下CPU是否存在问题呀 [复制链接]

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:49:03
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-06-02 22:10 |只看该作者 |倒序浏览
# psrinfo -v
虚拟处理器 0 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 1 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 2 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 3 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 4 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 5 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:11:20 开始已在运行。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 6 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 7 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:11:17 开始已在运行。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 16 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 17 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 18 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 19 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 20 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 21 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:11:20 开始已在运行。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 22 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器
虚拟处理器 23 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:11:20 开始已在运行。
  sparcv9 处理器以 1800 MHz 运行,
  而且有 sparcv9 浮点数处理器


我的CPU到底是几个呀,上面那个开始错误的,是什么意思?

# /usr/sbin/prtdiag -v
系统配置:  Sun Microsystems  sun4u Sun Fire V890
系统时钟频率:150 MHz
内存大小:32768 兆字节

========================= CPUs ===============================================

           运行  E$  CPU    CPU  
Brd  CPU   MHz   MB Impl.   掩码
--- ----- ---- ---- ------- ----
A  0, 16 1800 32.0 US-IV+   2.4
B  1, 17 1800 32.0 US-IV+   2.4
A  2, 18 1800 32.0 US-IV+   2.4
B  3, 19 1800 32.0 US-IV+   2.4
C  4, 20 1800 32.0 US-IV+   2.4
D  5, 21 1800 32.0 US-IV+   2.4
C  6, 22 1800 32.0 US-IV+   2.4
D  7, 23 1800 32.0 US-IV+   2.4


看着是8CPU,双核的,但上面有那么多的故障不知道是为什么
另外使用MPSTAT查
只能看到5,7 ,21,23
是不是代表其它的都故障了?
# mpstat
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl
  5  383   4  279  2235  269  739   68   82  654    6  2160   21   4   0  74
  7  314   5  261   417  259  751   67   78  624    6  1992   20   3   0  77
21  219   2  166    75    5  476   66   60  624    4  1671   23   2   0  75
23  228   2  299   380  328  564   67   70  651    4  1787   20   3   0  77

# mpstat -p 2 30
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl set
  5  383   4  279  2235  269  739   68   82  654    6  2160   21   4   0  74   0
  7  314   5  261   417  259  751   67   78  624    6  1992   20   3   0  77   0
21  219   2  166    75    5  476   66   60  624    4  1671   23   2   0  75   0
23  228   2  299   380  328  564   67   70  651    4  1787   20   3   0  77   0
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl set
  5  470   0  546  4410  498  944  457   67   28    2  2826   95   5   0   0   0
  7  171   0  536   846  389  914  449   38 2672    0  2732   96   4   0   0   0
21 1511   0  690   646    6 1325  632   64   12    0  3844   90  10   0   0   0
23  259   1  715   765  572  420  190   41 3519    1  2212   96   4   0   0   0
CPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl set
  5    0   3  249  3297  212  346  173   41    4    1  2615   99   1   0   0   0
  7  160   0  353   514  228  534  258   45    3    1  2505   98   2   0   0   0
21  310   4  176   639    5 1353  624   54    4    5  3367   94   6   0   0   0

23  125   0  575   748  544  425  199   35    6    0  2307   98   2   0   0   0
说明:
虚拟处理器 18 在下列时间的状态:06/02/2011 14:57:39
  自 11/16/2009 23:12:27 开始错误的
而且mpstat命令能看到只有5,7,21,23
其能跟psrinfo的对应上
但看messages中没有记录。可能确实是从2009年就出问题了。
FMA的消息中有这样的。

------------- ------------------------------------  -------------- ---------
TIME            EVENT-ID                              MSG-ID         SEVERITY
--------------- ------------------------------------  -------------- ---------
Nov 02 22:23:09 115feb8e-8d0f-6469-8c74-9c22387b51f0  SUN4U-8000-XJ  Major   

Fault class : fault.cpu.ultraSPARC-IVplus.l2cachedata
Affects     : cpu:///cpuid=2/serial=80020210896D59B2
              cpu:///cpuid=18/serial=80020210896D59B2
                  faulted and taken out of service
FRU         : "Slot A" (hc://:product-id=SUNW,Sun-Fire-V890:server-id=OMCRYS-o/component=Slot A)

Description : The number of errors associated with this CPU has exceeded
              acceptable levels.  Refer to http://sun.com/msg/SUN4U-8000-XJ for
              more information.

Response    : The fault manager will attempt to remove the affected CPU from
              service.

Impact      : System performance may be affected.

Action      : Schedule a repair procedure to replace the affected CPU, the
              identity of which can be determined using fmdump -v -u
              <EVENT_ID>.

我只截取一段。

论坛徽章:
0
2 [报告]
发表于 2011-06-03 09:54 |只看该作者
Slot A的板子至少需要换掉。


fmdump -v -u <EVENT_ID>.看看


没看到Slot B的,估计也得换掉。

论坛徽章:
2
双鱼座
日期:2014-02-23 12:10:03操作系统版块每日发帖之星
日期:2015-12-17 06:20:00
3 [报告]
发表于 2011-06-03 14:25 |只看该作者
fma里面的信息如果不清掉会一直记录以前的错误信息,可能以前坏CPU早都更换过了呢?

论坛徽章:
0
4 [报告]
发表于 2011-06-03 15:22 |只看该作者
repair下

论坛徽章:
2
双鱼座
日期:2014-02-23 12:10:03操作系统版块每日发帖之星
日期:2015-12-17 06:20:00
5 [报告]
发表于 2011-06-03 15:47 |只看该作者
LS是来刷屏的吧医生对病人说:你这病吃药就好了,回家吧

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:49:03
6 [报告]
发表于 2011-06-04 23:20 |只看该作者
没准真是,谢谢蜘蛛的答复。

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:49:03
7 [报告]
发表于 2011-06-04 23:21 |只看该作者
那个mpstat的状态显示也是受以前没清理的状态的影响啊?

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
8 [报告]
发表于 2011-06-05 08:41 |只看该作者
8个4核CPU

论坛徽章:
0
9 [报告]
发表于 2011-06-05 17:02 |只看该作者
我也遇到fma中以前的问题没有清掉,导致M5000小型机亮黄灯的情况
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP