免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 11390 | 回复: 9
打印 上一主题 下一主题

[求助] HP-superdome自动重启,求助 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-02-07 00:40 |只看该作者 |倒序浏览
各位大侠:

HP-UX自动重启,OLDsyslog如下:

Feb  6 16:58:30 vmunix: MCA[34]: MCA has occurred                                                               
Feb  6 16:58:30 vmunix: MCA[34]: Error Severity: recoverable                                                   
Feb  6 16:58:30 vmunix:                                                                                         
Feb  6 16:58:30 vmunix: MCA[34]: Platform Specific General Data                                                
Feb  6 16:58:30 vmunix: MCA[34]: Platform Specific Data = N/A                                                   
Feb  6 16:58:30 vmunix: MCA[34]: Error Status val = N/A                                                         
Feb  6 16:58:30 vmunix: MCA[34]: Error Status type = N/A                                                        
Feb  6 16:58:30 vmunix: MCA[34]: Processor Error Device Info decode begins                                      
Feb  6 16:58:30 vmunix: MCA[34]: VALIDATION_BITS = 0x000000000101000f                                          
Feb  6 16:58:30 vmunix: MCA[34]: PSP = 0x40000000eff27120                                                      
Feb  6 16:58:30 vmunix: MCA[34]: MCA not continuable, but may be recoverable (PSP.co == 0)                     
Feb  6 16:58:30 vmunix: MCA/CMC[34]: regfile check.   info:0x8480000000020013                                   
Feb  6 16:58:30 vmunix: MCA/CMC[34]: req:N/A res:N/A                                                            
Feb  6 16:58:30 vmunix: MCA/CMC[34]: tgt:N/A ip:N/A                                                            
Feb  6 16:58:30 vmunix: MCA[34]: PSI_STATIC_STRUCT.VALID_FIELD_BITS=0x000000000000001f                          
Feb  6 16:58:30 vmunix: MCA[34]: Processor Error Device Info decode ends                                       
Feb  6 16:58:30 vmunix: MCA[34]: MCA Recovery - attempting to terminate process                                 
Feb  6 16:58:30 vmunix: MCA[34]: MCA Recovery - thread = 0xe000000d02d66300                                    
Feb  6 16:58:30 vmunix: MCA[34]: MCA Recovery - process ID = 29074                                             
Feb  6 16:58:30 vmunix: MCA[34]: MCA Recovery - process name = ocssd.bin                                       
Feb  6 16:58:30 vmunix: MCA[34]: MCA Recovery - HPUX process termination successful                             
Feb  6 16:58:30 vmunix: MCA[34]: MCA Recovery - elapsed time = 164 msecs                                       
Feb  6 16:58:30 vmunix: MCA[34]: MCA Recovery - resuming system execution, no user action required              

MP中有报错:

MP:VWR (<cr>,<sp>,+,-,?,F,L,J,D,K,R,T,A,C,U,<Ctrl-b>) >  
Log Entry 22694:    02/06/2014 17:44:13
Alert level 3:  Warning
Keyword:  HP-UX_DUMP_STATUS
OS dump status  (EFxx)
Reporting Entity:  HP Unix located in cabinet 0, slot 0, cpu 0
Legacy PA HEX Code:  0xaef00
0x7f80033900e025c2 0x00000000000aef00
0x6b00033900e025c3 0x0100000052f3c9ed

Log Entry 22693:    02/06/2014 17:37:24
Alert level 7:  Fatal
Keyword:  HP-UX_OS_CRITICAL_SHUTDOWN
HP-UX OS shutdown due to an MCA or INIT
Reporting Entity:  HP Unix located in cabinet 0, slot 0, cpu 0
System State Change:  OS is shutting down
0xf4801c3100e025c0 0x000000000019100c
0xeb001c3100e025c1 0x0100000052f3c854






MP:VWR (<cr>,<sp>,+,-,?,F,L,J,D,K,R,T,A,C,U,<Ctrl-b>) >  
Log Entry 22693:    02/06/2014 17:37:24
Alert level 7:  Fatal
Keyword:  HP-UX_OS_CRITICAL_SHUTDOWN
HP-UX OS shutdown due to an MCA or INIT
Reporting Entity:  HP Unix located in cabinet 0, slot 0, cpu 0
System State Change:  OS is shutting down
0xf4801c3100e025c0 0x000000000019100c
0xeb001c3100e025c1 0x0100000052f3c854

Log Entry 22692:    02/06/2014 17:37:23
Alert level 2:  Informational
Keyword:  BR_TO_OS_INIT
Branch to OS INIT
Reporting Entity:  System Firmware located in cabinet 0, slot 3, cpu 7
Implementation Dependent:  0x00000001020616b0
0x5680007237e025be 0x00000001020616b0
0x4b00007237e025bf 0x0100000052f3c853



论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
2 [报告]
发表于 2014-02-07 11:17 |只看该作者
回复 1# luozb0076

这是有MCA了,看看系统/var/tombstones下面有没有保存到该事件点的mca文件,有的话找HP分析吧。

   

论坛徽章:
2
技术图书徽章
日期:2013-11-15 00:23:25双鱼座
日期:2013-11-25 13:13:29
3 [报告]
发表于 2014-02-10 10:25 |只看该作者
回复 2# lbseraph


    MCA是什么

论坛徽章:
0
4 [报告]
发表于 2014-02-10 17:06 |只看该作者
版主好

/var/tombstones下面没有生成MCA的dump文件。
看了shutdownlog,reboot类型为panic

想请问下,MCA的报错是否和CPU有关?谢谢

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
5 [报告]
发表于 2014-02-11 19:21 |只看该作者
回复 4# luozb0076

从OLDsyslog看是说MCA有recover了,如果能重启,下次进到EFI里面抓取errdump mca和errdump cmc的日志。
   

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
6 [报告]
发表于 2014-02-11 19:26 |只看该作者
回复 4# luozb0076

如果确认硬件没问题了(如果是硬件问题的话,过段时间还是会出现MCA自动重启的),最好看看有没有和MCA相关的patch没打,抽时间打一下。

参考链接:
http://www.itpub.net/forum.php?m ... 6105&highlight=
   

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
7 [报告]
发表于 2014-02-11 19:30 |只看该作者
回复 3# lgatuk

如果你知道HPMC(PA-RISC)是什么就行了,MCA是IA上面的,全称是Machine Check Abort。一般是CPU检测到严重的问题(整个bus上的任何一个备件)的时候触发的,发生的时候基本是会硬件重启,有的重启后系统无法起来(没法过硬件自检),有的重启后就恢复正常了(这种应该是recovered的情况)。

参考链接:
http://h20565.www2.hp.com/portal ... 876444892.492883150
   

论坛徽章:
2
技术图书徽章
日期:2013-11-15 00:23:25双鱼座
日期:2013-11-25 13:13:29
8 [报告]
发表于 2014-02-12 11:14 |只看该作者
回复 7# lbseraph


    谢谢师傅 我读了连接 知道了IA的MCA 也知道了HP9000/PA-RISC的HPMC
象诸如CPU、内存、总线等的硬件故障,都会产生HPMC(high priority Mechine Check ) Code,那么查看的方法是:
     Main Menu>ser
     Service Menu>pim

我又读了许多HPUX的启动过程 我想问个问题 HP9000和IA的启动过程相差大么 有哪些需要注意的差别

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
9 [报告]
发表于 2014-02-12 16:59 |只看该作者
回复 8# lgatuk

启动内核那一部分应该都差不多,我也没细究过。最明显的区别是启动内核时boot loader不一样吧,一个是BCH的界面进去,一个是EFI Shell;后面的init的顺序应该一样的。
   

论坛徽章:
0
10 [报告]
发表于 2015-01-30 09:39 |只看该作者
版主英明,真没有想到这么多人回复,感谢大家,后来检查硬件没有问题,应该是OS的bug,重启一次后就没有在重启过了!需要打系统的补丁,
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP