免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4027 | 回复: 4

最近t2000服务器经常死机,麻烦分析下 [复制链接]

论坛徽章:
0
发表于 2014-08-25 09:36 |显示全部楼层
Aug 22 13:08:33 hnltcs5 SC Alert: [ID 232877 daemon.alert] TEMP_SENSOR at MB/CMP0/T_BCORE has exceeded high warning threshold.
Aug 22 13:34:33 hnltcs5 SC Alert: [ID 323706 daemon.alert] VOLTAGE_SENSOR at SC/BAT/V_BAT has exceeded low warning threshold.
Aug 22 14:00:21 hnltcs5 SC Alert: [ID 631922 daemon.alert] SC initiating soft host system shutdown due to fault at MB/CMP0/T_TCORE.
Aug 22 14:00:22 hnltcs5 unix: [ID 488321 kern.warning] WARNING: Power-off requested, system will now shutdown.
Aug 22 14:00:22 hnltcs5 SC Alert: [ID 222544 daemon.error] SC Request to Power Off Host.
Aug 22 14:00:22 hnltcs5 ebus: [ID 521012 kern.info] su0 at ebus0: offset 0,3f8
Aug 22 14:00:22 hnltcs5 genunix: [ID 936769 kern.info] su0 is /pci@7c0/pci@0/pci@1/pci@0/isa@2/serial@0,3f8
Aug 22 14:00:23 hnltcs5 scsi: [ID 193665 kern.info] sd1 at mpt0: target 3 lun 0
Aug 22 14:00:23 hnltcs5 genunix: [ID 936769 kern.info] sd1 is /pci@780/pci@0/pci@9/scsi@0/sd@3,0
Aug 22 14:00:23 hnltcs5 SC Alert: [ID 118250 daemon.alert] TEMP_SENSOR at MB/CMP0/T_TCORE has exceeded high soft shutdown threshold.
Aug 22 14:00:24 hnltcs5 SC Alert: [ID 168716 daemon.alert] TEMP_SENSOR at MB/CMP0/T_BCORE has exceeded high soft shutdown threshold.
Aug 22 14:00:25 hnltcs5 inetd[385]: [ID 702911 daemon.warning] inetd_offline method for instance svc:/application/x11/xfs:default is
unspecified.  Taking default action: kill.
Aug 22 14:00:26 hnltcs5 inetd[385]: [ID 702911 daemon.warning] inetd_offline method for instance svc:/application/font/stfsloader:de
fault is unspecified.  Taking default action: kill.
Aug 22 14:00:26 hnltcs5 inetd[385]: [ID 702911 daemon.warning] inetd_offline method for instance svc:/network/rpc/cde-calendar-manag
er:default is unspecified.  Taking default action: kill.
Aug 22 14:00:27 hnltcs5 inetd[385]: [ID 702911 daemon.warning] inetd_offline method for instance svc:/network/rpc/cde-ttdbserver:tcp
is unspecified.  Taking default action: kill.
Aug 22 14:00:29 hnltcs5 inetd[385]: [ID 702911 daemon.error] Property 'name' of instance svc:/network/stdiscover:default is missing,
inconsistent or invalid
Aug 22 14:00:29 hnltcs5 inetd[385]: [ID 702911 daemon.error] Property 'proto' of instance svc:/network/stdiscover:default is missing
, inconsistent or invalid
Aug 22 14:00:29 hnltcs5 inetd[385]: [ID 702911 daemon.error] Property 'name' of instance svc:/network/stlisten:default is missing, i
nconsistent or invalid
Aug 22 14:00:29 hnltcs5 inetd[385]: [ID 702911 daemon.error] Property 'proto' of instance svc:/network/stlisten:default is missing,
inconsistent or invalid
Aug 22 14:00:40 hnltcs5 pseudo: [ID 129642 kern.info] pseudo-device: pm0
Aug 22 14:00:40 hnltcs5 genunix: [ID 936769 kern.info] pm0 is /pseudo/pm@0

论坛徽章:
0
发表于 2014-08-25 09:39 |显示全部楼层
bash-3.00#   prtdiag -v
系统配置:  Sun Microsystems  sun4v Netra T2000
内存大小:8064 兆字节

================================ Virtual CPUs ================================


CPU ID Frequency Implementation         Status
------ --------- ---------------------- -------
0      1000 MHz  SUNW,UltraSPARC-T1              
1      1000 MHz  SUNW,UltraSPARC-T1              
2      1000 MHz  SUNW,UltraSPARC-T1              
3      1000 MHz  SUNW,UltraSPARC-T1              
4      1000 MHz  SUNW,UltraSPARC-T1              
5      1000 MHz  SUNW,UltraSPARC-T1              
6      1000 MHz  SUNW,UltraSPARC-T1              
7      1000 MHz  SUNW,UltraSPARC-T1              
8      1000 MHz  SUNW,UltraSPARC-T1              
9      1000 MHz  SUNW,UltraSPARC-T1              
10     1000 MHz  SUNW,UltraSPARC-T1              
11     1000 MHz  SUNW,UltraSPARC-T1              
12     1000 MHz  SUNW,UltraSPARC-T1              
13     1000 MHz  SUNW,UltraSPARC-T1              
14     1000 MHz  SUNW,UltraSPARC-T1              
15     1000 MHz  SUNW,UltraSPARC-T1              

======================= Physical Memory Configuration ========================
Segment Table:
--------------------------------------------------------------
Base           Segment  Interleave  Bank     Contains
Address        Size     Factor      Size     Modules
--------------------------------------------------------------
0x0            8 GB     4           2 GB     MB/CMP0/CH0/R0/D0
                                             MB/CMP0/CH0/R0/D1
                                    2 GB     MB/CMP0/CH1/R0/D0
                                             MB/CMP0/CH1/R0/D1
                                    2 GB     MB/CMP0/CH2/R0/D0
                                             MB/CMP0/CH2/R0/D1
                                    2 GB     MB/CMP0/CH3/R0/D0
                                             MB/CMP0/CH3/R0/D1


========================= IO 配置 =========================

            IO                                                                                         
Location    Type  Slot Path                                          Name                      Model   
----------- ----- ---- --------------------------------------------- ------------------------- ---------
IOBD/NET0    PCIE IOBD                /pci@780/pci@0/pci@1/network@0    network-pciex8086,105e         
IOBD/NET1    PCIE IOBD              /pci@780/pci@0/pci@1/network@0,1    network-pciex8086,105e         
IOBD/PCIE    PCIE IOBD                   /pci@780/pci@0/pci@9/scsi@0         scsi-pciex1000,56 LSI,1064E
IOBD/PCIX    PCIX IOBD              /pci@7c0/pci@0/pci@1/pci@0/isa@2                       isa         
IOBD/PCIX    PCIX IOBD              /pci@7c0/pci@0/pci@1/pci@0/usb@5       usb-pciclass,0c0310         
IOBD/PCIX    PCIX IOBD              /pci@7c0/pci@0/pci@1/pci@0/usb@6       usb-pciclass,0c0310         
IOBD/PCIX    PCIX IOBD              /pci@7c0/pci@0/pci@1/pci@0/ide@8          ide-pci10b9,5229         
IOBD/NET2    PCIE IOBD                /pci@7c0/pci@0/pci@2/network@0    network-pciex8086,105e         
IOBD/NET3    PCIE IOBD              /pci@7c0/pci@0/pci@2/network@0,1    network-pciex8086,105e         
IOBD/PCIE0   PCIE    0           /pci@7c0/pci@0/pci@8/SUNW,XVR-300@0              SUNW,XVR-300 SUNW,375-+

========================= HW 修订 =======================================

系统 PROM 修订:
----------------------
OBP 4.28.9 2008/06/30 21:26

IO ASIC 修订版:
------------------
Location             Path                                          Device                         Revision
-------------------- --------------------------------------------- ------------------------------ ---------
IOBD/IO-BRIDGE                                     /pci@780                 SUNW,sun4v-pci     0
IOBD/PCI-SWITCH0                             /pci@780/pci@0              pciex10b5,8532.bc   188
IOBD/IO-BRIDGE                                     /pci@7c0                 SUNW,sun4v-pci     0
IOBD/PCI-SWITCH1                             /pci@7c0/pci@0              pciex10b5,8532.bc   188
IOBD/PCI-BRIDGE                  /pci@780/pci@0/pci@8/pci@0                pciex8086,340.9     9
IOBD/PCI-BRIDGE                  /pci@7c0/pci@0/pci@1/pci@0                pciex8086,340.9     9
IOBD/PCI-BRIDGE                  /pci@7c0/pci@0/pci@9/pci@0                pciex8086,340.9     9
IOBD/PCI-BRIDGE                /pci@7c0/pci@0/pci@9/pci@0,2                pciex8086,341.9     9
IOBD/GBE0                    /pci@780/pci@0/pci@1/network@0     pciex8086,105e.108e.105e.6     6
IOBD/GBE0                  /pci@780/pci@0/pci@1/network@0,1     pciex8086,105e.108e.105e.6     6
IOBD/GBE1                    /pci@7c0/pci@0/pci@2/network@0     pciex8086,105e.108e.105e.6     6
IOBD/GBE1                  /pci@7c0/pci@0/pci@2/network@0,1     pciex8086,105e.108e.105e.6     6

============================ Environmental Status ============================
Fan sensors:
------------------------------------------------------------
Location                           Sensor         Status   
------------------------------------------------------------
CH/FT0/F0                          TACH           ok
       CH/FT0/F1                          TACH           ok
CH/FT0/F2                          TACH           ok
CH/FT1/F0                          TACH           ok
CH/FT1/F1                          TACH           ok
CH/PS0/F0                          RS             ok
CH/PS1/F0                          RS             ok

Temperature sensors:
------------------------------------------------------------
Location                           Sensor         Status   
------------------------------------------------------------
CH/IOBD/IOB                        T_CORE         ok
CH/IOBD                            T_AMB          ok
CH/MB/CMP0                         T_TCORE        ok
CH/MB/CMP0                         T_BCORE        ok
CH/MB                              T_AMB          ok
CH/PDB                             T_AMB          ok
CH/PDB                             ADT7462_AMB    ok

Current sensors:
------------------------------------------------------------
Location                           Sensor         Status   
------------------------------------------------------------
CH/MB                              I_VCORE        ok
CH/MB                              I_VMEML        ok
CH/MB                              I_VMEMR        ok

Current indicators:
------------------------------------------------------------
Location                           Indicator      Condition
------------------------------------------------------------
CH/IOBD                            I_USB0         ok      
CH/IOBD                            I_USB1         ok      

Voltage sensors:
------------------------------------------------------------
Location                           Sensor         Status   
------------------------------------------------------------
CH/SC/BAT                          V_BAT          disabled
CH/IOBD                            V_+1V5         ok
CH/IOBD                            V_+1V8         ok
CH/IOBD                            V_+3V3MAIN     ok
CH/IOBD                            V_+3V3STBY     ok
CH/IOBD                            V_+1V          ok
CH/IOBD                            V_+1V2         ok
CH/IOBD                            V_+5V          ok
CH/IOBD                            V_-12V         ok
CH/IOBD                            V_+12V         ok
CH/MB                              V_+1V5         ok
CH/MB                              V_VMEML        ok
CH/MB                              V_VMEMR        ok
CH/MB                              V_VTTL         ok
CH/MB                              V_VTTR         ok
CH/MB                              V_+3V3STBY     ok
CH/MB                              V_VCORE        ok

LEDs:
------------------------------------------------------------
Location                           LED            State   
------------------------------------------------------------
CH/ALARM                           CRITICAL       off     
CH/ALARM                           MAJOR          off     
CH/ALARM                           MINOR          off     
CH/ALARM                           USER           off     
CH/SYS                             ACT            steady  
CH/SYS                             LOCATE         off     
CH/SYS                             SERVICE        steady  
CH/HDD0                            SERVICE        off     
CH/HDD0                            OK2RM          off     
CH/HDD1                            SERVICE        off     
CH/HDD1                            OK2RM          off     
CH/HDD2                            SERVICE        off     
CH/HDD2                            OK2RM          off     
CH/HDD3                            SERVICE        off     
CH/HDD3                            OK2RM          off     

============================ FRU Status ============================
Location                           Name      Status  
------------------------------------------------------
CH/FT0/F0                          FAN       enabled  
CH/FT0/F1                          FAN       enabled  
CH/FT0/F2                          FAN       enabled  
CH/FT1/F0                          FAN       enabled  
CH/FT1/F1                          FAN       enabled  
CH/PS0/F0                          FAN       enabled  
CH/PS0                             PS        disabled
CH/PS1/F0                          FAN       enabled  
CH/PS1                             PS        enabled  
CH                                 SC        disabled
CH                                 IOBD      enabled  
CH                                 MB        enabled  
CH/MB/CMP0/CH0/R0/D0               DIMM      enabled  
CH/MB/CMP0/CH0/R0/D1               DIMM      enabled  
CH/MB/CMP0/CH1/R0/D0               DIMM      enabled  
CH/MB/CMP0/CH1/R0/D1               DIMM      enabled  
CH/MB/CMP0/CH2/R0/D0               DIMM      enabled  
CH/MB/CMP0/CH2/R0/D1               DIMM      enabled  
CH/MB/CMP0/CH3/R0/D0               DIMM      enabled  
CH/MB/CMP0/CH3/R0/D1               DIMM      enabled  
CH                                 PDB       enabled  
CH                                 ALARM     enabled  
CH                                 SASBP     enabled  
CH                                 PCIMEZZ   enabled  

============================ FW Version ============================
Version
------------------------------------------------------------
System Firmware 6.6.4 Netra[TM] T2000 2008/07/01 0

====================== System PROM revisions =======================
Version
------------------------------------------------------------
OBP 4.28.9 2008/06/30 21:26

论坛徽章:
20
申猴
日期:2013-09-12 19:39:05狮子座
日期:2014-07-20 21:19:51寅虎
日期:2014-08-16 18:37:47水瓶座
日期:2014-10-15 18:58:25天蝎座
日期:2015-01-22 18:19:15NBA常规赛纪念章
日期:2015-05-04 22:32:032015亚冠之胡齐斯坦钢铁
日期:2015-06-03 11:28:502015亚冠之吉达阿赫利
日期:2015-09-19 12:41:47午马
日期:2013-09-18 14:36:40戌狗
日期:2013-09-18 14:44:39处女座
日期:2013-09-24 17:46:41CU十二周年纪念徽章
日期:2013-10-24 15:41:34
发表于 2014-08-25 09:44 |显示全部楼层
先换电池和电源,清除故障后看是否还有主板温度告警。

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
发表于 2014-08-25 09:48 |显示全部楼层
第一个log直接就告诉你是温度问题了.

论坛徽章:
1
19周年集字徽章-19
日期:2020-01-08 15:08:20
发表于 2014-08-25 23:57 |显示全部楼层
Aug 22 13:08:33 hnltcs5 SC Alert: [ID 232877 daemon.alert] TEMP_SENSOR at MB/CMP0/T_BCORE has exceeded high warning threshold.
Aug 22 13:34:33 hnltcs5 SC Alert: [ID 323706 daemon.alert] VOLTAGE_SENSOR at SC/BAT/V_BAT has exceeded low warning threshold.
Aug 22 14:00:21 hnltcs5 SC Alert: [ID 631922 daemon.alert] SC initiating soft host system shutdown due to fault at MB/CMP0/T_TCORE.
Aug 22 14:00:22 hnltcs5 unix: [ID 488321 kern.warning] WARNING: Power-off requested, system will now shutdown.

宕机应该是由于温度过高造成的  

另外你这个机器SC电池过期了要更换,不过这个不会导致宕机的。

先解决温度过高的问题

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP