fchunt888 发表于 2015-04-07 22:48

D疼的P6 595又出问题了

机房有台P6 595,胎里病,之前主板都换过了,现在最下面有一个扩展柜,半个柜子加不了电,全黑。从去年年末开始老是报一个错,因为是T H的报错,而且硬盘网卡光纤卡都是正常的,就没有理会,现在出去原因要备份系统,动态移动磁带机的时候出现问题。报错如下

root@p595c1:/>errpt -aj 12296806|more
---------------------------------------------------------------------------
LABEL:          SAS_ERR3
IDENTIFIER:   12296806

Date/Time:       Tue Apr7 19:21:47 BEIST 2015
Sequence Number: 3028469
Machine Id:      00CD96344C00
Node Id:         p595c1
Class:         H
Type:            TEMP
Resource Name:   sissas0         
Resource Class:adapter
Resource Type:   14103a03
Location:      U5803.001.99B00KF-P1-C10-T1
VPD:            
      PCI Express x8 Ext Dual-x4 3Gb SAS Adapter      :
      Part Number.................44V8580
      FRU Number..................44V8580
      Serial Number...............YL10D9128613
      Manufacture ID..............000D
      EC Level....................0
      ROM Level.(alterable).......03220051
      Customer Card ID Number.....57B3
      Product Specific.(Z1).......1

Description
SAS ERROR

      Recommended Actions
      PERFORM PROBLEM DETERMINATION PROCEDURES
      CHECK CABLE AND ITS CONNECTIONS

Detail Data

ADDITIONAL HEX DATA
0000 019C 0000 0A00 0000 0000 0000 0000 0000 0000 1910 0120 0405 0000 0101 0000
0322 0051 0000 0100 57B3 3002 5005 076C 0619 8C0E 0000 0000 0000 0000 0000 0000
0405 0000 0030 0030 0000 03FF 0000 0000 0000 0000 0000 0000 0000 0000 8000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 2422 1200 0003 FF00 0000 0000 0000 0000 0000 000A 0400 1001 0000 0A00
00A2 44B4 5005 076C 0619 8C0E 0D00 0402 2D00 4002 4942 4D20 2020 2020 3537 3230
2D30 3031 2020 2020 2020 2020 3030 3230 3239 3030 3231 3431 0000 0000

后来发现sissas0 下面挂载着动态的外置磁带机和光驱,在动态移动资源的之前,肯定是要删除PCI总线和子设备的,再删除完以后再用cfgmgr,之前的cd0和rmt4全都消失了,其他分区上找了,没找到。U5803.001.99B00KF-P1-C10的位置是在5802的扩展柜后面,应该是插那种又黑又粗的SCSI数据线的卡。个人判断是有可能PCI背板(背板和SCSI卡是一体的貌似)或者SCSI线有问题,导致挂载的设备cd0和rmt4丢失,希望高人指点。PS:真的不是所有TH错误都可以被忽略!

anthonypaopao 发表于 2015-04-08 13:53

删除肯定是删除这块卡下面的子设备,动态迁移资源的时候在HMC上操作了没?
我觉得线的问题可能性更大一些,建议把SAS线重新插拔下试试

sucheng1031 发表于 2015-04-30 03:31

页: [1]
查看完整版本: D疼的P6 595又出问题了