- 论坛徽章:
- 1
|
# psrinfo -v
虚拟处理器 0 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 1 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 2 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 3 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 4 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 5 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:11:20 开始已在运行。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 6 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 7 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:11:17 开始已在运行。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 16 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 17 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 18 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 19 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 20 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 21 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:11:20 开始已在运行。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 22 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
虚拟处理器 23 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:11:20 开始已在运行。
sparcv9 处理器以 1800 MHz 运行,
而且有 sparcv9 浮点数处理器
我的CPU到底是几个呀,上面那个开始错误的,是什么意思?
# /usr/sbin/prtdiag -v
系统配置: Sun Microsystems sun4u Sun Fire V890
系统时钟频率:150 MHz
内存大小:32768 兆字节
========================= CPUs ===============================================
运行 E$ CPU CPU
Brd CPU MHz MB Impl. 掩码
--- ----- ---- ---- ------- ----
A 0, 16 1800 32.0 US-IV+ 2.4
B 1, 17 1800 32.0 US-IV+ 2.4
A 2, 18 1800 32.0 US-IV+ 2.4
B 3, 19 1800 32.0 US-IV+ 2.4
C 4, 20 1800 32.0 US-IV+ 2.4
D 5, 21 1800 32.0 US-IV+ 2.4
C 6, 22 1800 32.0 US-IV+ 2.4
D 7, 23 1800 32.0 US-IV+ 2.4
看着是8CPU,双核的,但上面有那么多的故障不知道是为什么
另外使用MPSTAT查
只能看到5,7 ,21,23
是不是代表其它的都故障了?
# mpstat
CPU minf mjf xcal intr ithr csw icsw migr smtx srw syscl usr sys wt idl
5 383 4 279 2235 269 739 68 82 654 6 2160 21 4 0 74
7 314 5 261 417 259 751 67 78 624 6 1992 20 3 0 77
21 219 2 166 75 5 476 66 60 624 4 1671 23 2 0 75
23 228 2 299 380 328 564 67 70 651 4 1787 20 3 0 77
# mpstat -p 2 30
CPU minf mjf xcal intr ithr csw icsw migr smtx srw syscl usr sys wt idl set
5 383 4 279 2235 269 739 68 82 654 6 2160 21 4 0 74 0
7 314 5 261 417 259 751 67 78 624 6 1992 20 3 0 77 0
21 219 2 166 75 5 476 66 60 624 4 1671 23 2 0 75 0
23 228 2 299 380 328 564 67 70 651 4 1787 20 3 0 77 0
CPU minf mjf xcal intr ithr csw icsw migr smtx srw syscl usr sys wt idl set
5 470 0 546 4410 498 944 457 67 28 2 2826 95 5 0 0 0
7 171 0 536 846 389 914 449 38 2672 0 2732 96 4 0 0 0
21 1511 0 690 646 6 1325 632 64 12 0 3844 90 10 0 0 0
23 259 1 715 765 572 420 190 41 3519 1 2212 96 4 0 0 0
CPU minf mjf xcal intr ithr csw icsw migr smtx srw syscl usr sys wt idl set
5 0 3 249 3297 212 346 173 41 4 1 2615 99 1 0 0 0
7 160 0 353 514 228 534 258 45 3 1 2505 98 2 0 0 0
21 310 4 176 639 5 1353 624 54 4 5 3367 94 6 0 0 0
23 125 0 575 748 544 425 199 35 6 0 2307 98 2 0 0 0
说明:
虚拟处理器 18 在下列时间的状态:06/02/2011 14:57:39
自 11/16/2009 23:12:27 开始错误的
而且mpstat命令能看到只有5,7,21,23
其能跟psrinfo的对应上
但看messages中没有记录。可能确实是从2009年就出问题了。
FMA的消息中有这样的。
------------- ------------------------------------ -------------- ---------
TIME EVENT-ID MSG-ID SEVERITY
--------------- ------------------------------------ -------------- ---------
Nov 02 22:23:09 115feb8e-8d0f-6469-8c74-9c22387b51f0 SUN4U-8000-XJ Major
Fault class : fault.cpu.ultraSPARC-IVplus.l2cachedata
Affects : cpu:///cpuid=2/serial=80020210896D59B2
cpu:///cpuid=18/serial=80020210896D59B2
faulted and taken out of service
FRU : "Slot A" (hc://:product-id=SUNW,Sun-Fire-V890:server-id=OMCRYS-o/component=Slot A)
Description : The number of errors associated with this CPU has exceeded
acceptable levels. Refer to http://sun.com/msg/SUN4U-8000-XJ for
more information.
Response : The fault manager will attempt to remove the affected CPU from
service.
Impact : System performance may be affected.
Action : Schedule a repair procedure to replace the affected CPU, the
identity of which can be determined using fmdump -v -u
<EVENT_ID>.
我只截取一段。 |
|