免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 19538 | 回复: 3
打印 上一主题 下一主题

[求助] CPE_EM100103主机有如下告警信息 MP日志未发现硬件告警信息,不知是什么原因?求大神 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-04-02 15:00 |只看该作者 |倒序浏览
>------------ Event Monitoring Service Event Notification ------------<

Notification Time: Mon Mar 24 14:52:23 2014

cmccapp1 sent Event Monitor notification information:

/system/events/cpe/cperrors is >= 1.
Its current value is MAJORWARNING(3).



Event data from monitor:

Event Time..........: Mon Mar 24 14:52:23 2014
Severity............: MAJORWARNING
Monitor.............: cpe_em
Event #.............: 100103              
System..............: cmccapp1

Summary:
     A Corrected Platform Error was reported by PCI bus.


Description of Error:

     A platform error was corrected by the firmware/hardware. The error
     occurred on the Host Bridge Adapter. More information is available in the
     Event Details section of this event.

Probable Cause / Recommended Action:

    Contact your HP Support Representative to have the Host Bridge Adapter
    Interfaces checked.

Additional Event Data:
     System IP Address...: 130.192.7.143
     System IP Address...: 130.88.100.168
     Event Id............: 0x532fd62700000000
     Monitor Version.....: B.01.00
     Event Class.........: CPE
     Client Configuration File...........:
     /var/stm/config/tools/monitor/default_cpe_em.clcfg
     Client Configuration File Version...: A.01.00
          Qualification criteria met.
               Number of events..: 3
               Received within...: 1 day(s)
     Associated OS error log entry id(s):
          None
     Additional System Data:
          System Model Number.............: ia64 hp server rx6600
          EMS Version.....................: A.04.20.31.02
          STM Version.....................: D.04.00
          OS Version......................: B.11.31
          System Serial Number............: SGH4907L1H
     Latest information on this event:
          http://docs.hp.com/hpux/content/hardware/ems/cpe_em.htm#100103

v-v-v-v-v-v-v-v-v-v-v-v-v    D  E  T  A  I  L  S    v-v-v-v-v-v-v-v-v-v-v-v-v



Error Details:

   Error Recovery Info : 0x80

   Corrected Platform Error (PCI Bus) Record:

      Validation Bits: 0x0000000000000607   Error Status:   0x0000000000400100
      Error Type:      000000000000000000   Bus Id:         0x000000000000000f
      Bus Address:     Not valid       Bus Data:       Not valid   
      Bus Command:     Not valid       Bus Req Id:     Not valid   
      Bus Res Id:      Not valid       Bus Target Id:  Not valid   
      Bus OEM Id:      0x0000000012ee103c   000000000000000000


      Cell Number:     000000000000000000   SBA Number:     000000000000000000
      Rope Number:     0x0000000000000003   Err Status:     0x0000080000000810
      Err Master Id:   0x0000000000000002   Inbound Err Add:0x000001006bbca080
      Inbound Err Attr:0x48000008220f0800   Compl Msg Log:  000000000000000000
      Outbound Err Add:000000000000000000   Err Config:     0x0000000000009d50
      Status,Info,Ctrl:0x0000000000000010   Function Id:    0x02b0014612ee103c
      PCI-X Capabs:    0x4013ff0020010007   OLR Control     0x00066fb400032484
      Clock Control:   0x010005b300000008   Bus Mode:       0x000000000015e6ba
      Ecc Cntrl status:0x0000000080fd94d4   lmmio_base      0x00000000b0000001
      lmmio_mask:      0x00000000f0000000   gmmio_base      0x0000080300000001
      gmmio_mask:      0x00000fff00000000   wlmmio_base     0x0000000080000001
      wlmmio_mask:     0x0000000080000000   wgmmio_base     0x0000080000000001
      elmmio_base:     0x00000ff800000000   elmmio_mask     0x0000000080000000
      global add mask: 0x0000000080000000


=============================================================================
Explanation(s):

        Error Recovery Info : 0x80
            * Error has not been corrected
        Error Status : 0x0000000000400100
            * Internal Error
            * More errors not logged - resource overflow.
        Error Type   : 000000000000000000  


>---------- End Event Monitoring Service Event Notification ----------<

论坛徽章:
0
2 [报告]
发表于 2014-04-02 16:33 |只看该作者
Cell Number:     000000000000000000    ===>Cell 0  
Rope Number:     0x0000000000000003   ===>Rope 3

先确认服务器Rope3是PCI那个槽位

reset该槽位的PCI 卡,之后monitor 是否出现同样的100103 Event error
如果依然报错,换掉PCI卡(Cell#0 PCI#x)  ===>一般换卡很有可能会解决
如果还是依然报错,更换PCI-X Card cage

评分

参与人数 1可用积分 +5 收起 理由
lbseraph + 5 谢谢积极回复!

查看全部评分

论坛徽章:
0
3 [报告]
发表于 2014-04-02 16:37 |只看该作者
System Model Number.............: ia64 hp server rx6600

PCI-X Backplane

Rope 3 ==>PCI Slot#4

------------------------------
PCIe Combo Backplane

Rope 3 ==>PCI Slot#6

论坛徽章:
48
15-16赛季CBA联赛之青岛
日期:2021-01-07 13:41:2315-16赛季CBA联赛之上海
日期:2020-12-01 18:02:0720周年集字徽章-20	
日期:2020-10-28 14:14:2620周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之天津
日期:2020-10-18 22:51:412016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之北控
日期:2015-12-22 13:30:48操作系统版块每日发帖之星
日期:2015-12-07 06:20:00操作系统版块每日发帖之星
日期:2015-09-04 06:20:002015亚冠之德黑兰石油
日期:2015-08-05 18:46:082015年亚洲杯之巴勒斯坦
日期:2015-04-19 10:42:502015年亚洲杯之巴林
日期:2015-04-09 08:03:23
4 [报告]
发表于 2014-04-02 22:02 |只看该作者
本帖最后由 lbseraph 于 2014-04-02 22:02 编辑

这种已经recovered的error如果只出现一两次就继续观察,如果短时间反复出现,可以考虑换掉对应的HBA。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP