Chinaunix

标题: AutoRAID 12H问题救助! [打印本页]

作者: punish01    时间: 2007-06-16 21:35
标题: AutoRAID 12H问题救助!
各位大位,有哪位对AutoRAID熟悉的帮助给解决一下问题。
用户是两台A500共享一台AutoRAID 12H。12H里插了六块9GB的硬盘分别是A4,B4,A5,B5,A6
和B6。前几天B6插槽的硬盘告警。用arraydsp -a 命令查看阵列状态。只看不到B6磁盘。并有以下输入

   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Array State           = WARNING
   Server name           = smcp01
   Array type            = 3
   Mfg. Product Code     = IJMTU00004

   --- Disk space usage --------------------
   Total physical               = 43416 MB *
   Allocated to LUNs            = 24382 MB *
   Used as Active Hot spare     =     0 MB *
   Used by non-included disks   =     0 MB *
   Used for Redundancy          = 19034 MB *
   Unallocated (avail for LUNs) =     0 MB *
   -----------------------------------------

   THE FOLLOWING WARNING(S) EXIST:
   - Data Unavailable
   - Redundancy Loss
   - Active Hot Spare Unavailable
   - Rebuild Failed
   - Missing Disk


   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------

   LUN 0:

  。。。。。。。。。。。。。

   Information for disk in slot A6:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39103LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 168900001040
      Firmware revision      = HP02
      Drive ID number        = FFFFFFFD10A4ED10
      Volume set serial no.  = 14994       2

   Total capacity of all installed physical disks = 43416 MB *

   The following disk is reported MISSING by the controller:
      Vendor                 = SEAGATE
      Product ID             = ST39103LC      
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 283600001022
      Disk ID number         = FFFFFFFD1093A7FE
      Volume set serial no.  = 14994       2


   Information for controller X:
      Vendor ID            = HP      
      Product ID           = C5447A         
      Array serial number  = 0000000E0325
      Alias                = VOIP        
      Primary              = FALSE
      SCSI Address         = 1
      Serial number        = R99HADJ843721111
      Paired serial number = R9BJADJ913911111
      Product revision     = HP62
   。。。。。。。。。。。。。。。。。。。。

   看来盘丢失后rebuild失败了。于是安装上一个18GB的硬盘。等待阵列重构完后,再用arraydsp -a
命令查看。
       Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Array State           = WARNING
   Server name           = smcp02
   Array type            = 3
   Mfg. Product Code     = IJMTU00004

   --- Disk space usage --------------------
   Total physical               = 60782 MB *
   Allocated to LUNs            = 24382 MB *
   Used as Active Hot spare     =  8683 MB *
   Used by non-included disks   =     0 MB *
   Used for Redundancy          = 20088 MB *
   Unallocated (avail for LUNs) =  7629 MB *
   -----------------------------------------

   THE FOLLOWING WARNING(S) EXIST:
   - Data Unavailable
   - Redundancy Loss
   - Rebuild Failed
   - Missing Disk


   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------

   LUN 0:
   Capacity (MB=2^20) = 100 MB *
   Maximum block addr = 204800
   Block length       = 512

   LUN 1:
   Capacity (MB=2^20) = 8192 MB *
   Maximum block addr = 16777216
   Block length       = 512

   LUN 2:
   Capacity (MB=2^20) = 8112 MB *
   Maximum block addr = 16613376
   Block length       = 512

   LUN 3:
   Capacity (MB=2^20) = 5000 MB *
   Maximum block addr = 10240000
   Block length       = 512

   LUN 4:
   Capacity (MB=2^20) = 2978 MB *
   Maximum block addr = 6098944
   Block length       = 512

   Total capacity allocated to LUNs = 24382 MB *


   Information for disk in slot A4:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39103LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 790700007035
      Firmware revision      = HP01
      Drive ID number        = FFFFFFFD10B9427B
      Volume set serial no.  = 14994       2

   Information for disk in slot B4:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39102LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 374100001924
      Firmware revision      = HP03
      Drive ID number        = FFFFFFFD C611084
      Volume set serial no.  = 14994       2

   Information for disk in slot A5:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39103LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 911100001039
      Firmware revision      = HP02
      Drive ID number        = FFFFFFFD1090AF0F
      Volume set serial no.  = 14994       2

   Information for disk in slot B5:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39102LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 696600001939
      Firmware revision      = HP01
      Drive ID number        = BD99       1
      Volume set serial no.  = 14994       2

   Information for disk in slot A6:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39103LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 168900001040
      Firmware revision      = HP02
      Drive ID number        = FFFFFFFD10A4ED10
      Volume set serial no.  = 14994       2

   Information for disk in slot B6:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST318404LC
      Capacity               = 17366 MB *
      Max. block addr        = 35566479
      Block length           = 512
      Serial number          = LHE700002151
      Firmware revision      = HP04
      Drive ID number        = FFFFFFFD14000003
      Volume set serial no.  = 14994       2

   Total capacity of all installed physical disks = 60782 MB *

   The following disk is reported MISSING by the controller:
      Vendor                 = SEAGATE
      Product ID             = ST39103LC      
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 283600001022
      Disk ID number         = FFFFFFFD1093A7FE
      Volume set serial no.  = 14994       2


   Information for controller X:
      Vendor ID            = HP      
      Product ID           = C5447A         
      Array serial number  = 0000000E0325
      Alias                = VOIP        
      Primary              = FALSE
      SCSI Address         = 1
      Serial number        = R99HADJ843721111
      Paired serial number = R9BJADJ913911111
      Product revision     = HP62


   Information for controller Y:
      Vendor ID            = HP      
      Product ID           = C5447A         
      Array serial number  = 0000000E0325
      Alias                = VOIP        
      Primary              = TRUE
      SCSI Address         = 0
      Serial number        = R9BJADJ913911111
      Paired serial number = R99HADJ843721111
      Product revision     = HP62


   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Overall State of Array          = WARNING
   Array configuration:
      Active Hot Spare Desired     = ENABLED
      Auto Include                 = ENABLED
      Auto Rebuild                 = ENABLED
      Rebuild Priority             = HIGH
      Capacity Depletion Threshold = 0%
      Write Working Set Interval   = 8640 seconds
      Language                     = ENGLISH
      Log Full Warning             = DISABLED
      Volume Set Partitioning      = DISABLED
      Format Pattern Fill          = DISABLED
      Subsystem Type ID            = 12
      LUN Creation Limit           = 8
      Maximum LUN Creation Limit   = 8
   Array SCSI configuration:
      Controller X SCSI Address    = 1
      Controller Y SCSI Address    = 0
      Write Cache                  = ENABLED
      Read Cache                   = DISABLED
      SCSI Parity Checking         = ENABLED
      SDTR                         = ENABLED
      WDTR                         = ENABLED
      Terminator Power             = ENABLED
      Unit Attention               = ENABLED
      Disable Remote Reset         = ENABLED
      Secondary Controller Offline = DISABLED
      Very Early Busy              = DISABLED
      Queue Full Threshold         = 1952
      Maximum Queue Full Threshold = 1952
      Simplified Resiliency Setting = HighPerformance
      Single Controller Warning    = ENABLED
      Lock Write Cache On          = TRUE
      Disable NVRAM on WCE False   = FALSE
      Disable NVRAM with One Ctrlr = TRUE
      Disable NVRAM on UPS absent  = FALSE
      Force Unit Access Response   = 0
      Disable Read Hits            = FALSE
      Resiliency Threshold         = 0

   THE FOLLOWING WARNING(S) EXIST:
   - Data Unavailable
   - Redundancy Loss
   - Rebuild Failed
   - Missing Disk

   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Raid 0/1 blocks       = 465280
   Raid 0/1 block length = 512
   Raid 0/1 capacity     = 227 MB *

   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Fan F1              = GOOD
   Fan F2              = GOOD
   Fan F3              = GOOD
   Power supply PS1    = GOOD
   Power supply PS2    = GOOD
   Power supply PS3    = GOOD

   Controller X:
      Overall state    = GOOD
      Battery #0 state = GOOD
      Battery #1 state = GOOD
      DRAM    #0 state = GOOD
      NVRAM   #0 state = GOOD
      NVRAM   #1 state = GOOD
   Controller Y:
      Overall state    = GOOD
      Battery #0 state = GOOD
      Battery #1 state = GOOD
      DRAM    #0 state = GOOD
      NVRAM   #0 state = GOOD
      NVRAM   #1 state = GOOD
作者: punish01    时间: 2007-06-16 21:37
标题: 查看阵列日志
手动rebuild到99%更退出来了,查看阵列状态还是一样。用arraylog -e查看日志发现5月6日,A6和
B6都出现过被删除的错误,但是现在A6的状态是好的。以下是arraylog -e的输出:
  。。。。。。。。。。。。。。。。。。
Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 146
   Event code description = Disk Drive Removed
   Event count            = 1
   FRU ID                 = 11
   FRU description        = Disk in slot B6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 208
   Event code description          = Internal SCSI Bus State Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 194
   FRU description                 = ARM StringCatalog::GetStringCommonBuf(17, 195): No such string.

Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 99
   Event code description          = Write Recovered With RAID 5 Redundancy
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 146
   Event code description = Disk Drive Removed
   Event count            = 1
   FRU ID                 = 10
   FRU description        = Disk in slot A6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 178
   Event code description = Data Unavailable
   Event count            = 1
   FRU ID                 = 129
   FRU description        = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 44
   Event code description          = Unavailable Data Detected By RAID 1
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Disk error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp             = 2905208
   Event code                       = 232
   Event code description           = Data loss detected on LUN (identified by ASC)
   Event count                      = 1
   FRU number                       = 0
   FRU description                  = Disk in slot A1

   Slot number                      = A1
   Sense key                        = 0x0
   Additional Sense code            = 0x1
   Additional Sense code qualifier  = 0x80
   LBA                              = 59008

System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 44
   Event code description          = Unavailable Data Detected By RAID 1
   Event count                     = 15
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 208
   Event code description          = Internal SCSI Bus State Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 194
   FRU description                 = ARM StringCatalog::GetStringCommonBuf(17, 195): No such string.

Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Module Number                   = 1
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller

   Abnormal termination code (hex) = 16 a

System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 144
   Event code description = Disk Drive Installed
   Event count            = 1
   FRU ID                 = 10
   FRU description        = Disk in slot A6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 219
   Event code description = Member Disk Drive Added Back Into Disk Set
   Event count            = 1
   FRU ID                 = 10
   FRU description        = Disk in slot A6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 186
   Event code description = Drive Missing At Power On
   Event count            = 1
   FRU ID                 = 129
   FRU description        = Reporting Controller


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 178
   Event code description = Data Unavailable
   Event count            = 1
   FRU ID                 = 129
   FRU description        = Reporting Controller


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Usage record for Subsystem 0000000E0325 at Sun May  6 04:29:58 2007

Controller error record for Subsystem 0000000E0325 at Sun May  6 04:29:58 2007
   Controller timestamp            = 2905225
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Sun May  6 04:29:58 2007
   Controller timestamp   = 2905226
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1
作者: punish01    时间: 2007-06-16 21:38
标题: 换盘后生成的日志
。。。。。。。。。。。。。。。。。。。。。。。。。以下是换盘当天生成的日志
System change record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp   = 2957665
   Event code             = 144
   Event code description = Disk Drive Installed
   Event count            = 1
   FRU ID                 = 11
   FRU description        = Disk in slot B6


System change record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp   = 2957665
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


System change record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp   = 2957665
   Event code             = 145
   Event code description = Disk Drive Added To Disk Set
   Event count            = 1
   FRU ID                 = 11
   FRU description        = Disk in slot B6


Controller error record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp            = 2957667
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp   = 2957669
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1

Log File: /var/opt/hparray/log/L0005245

Usage record for Subsystem 0000000E0325 at Fri Jun 15 01:38:16 2007

Controller error record for Subsystem 0000000E0325 at Fri Jun 15 01:38:16 2007
   Controller timestamp            = 2957858
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Usage record for Subsystem 0000000E0325 at Fri Jun 15 01:53:17 2007

Usage record for Subsystem 0000000E0325 at Fri Jun 15 02:08:18 2007

Controller error record for Subsystem 0000000E0325 at Fri Jun 15 02:08:18 2007
   Controller timestamp            = 2957886
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Usage record for Subsystem 0000000E0325 at Fri Jun 15 02:23:19 2007

Controller error record for Subsystem 0000000E0325 at Fri Jun 15 02:23:19 2007
   Controller timestamp            = 2957895
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Usage record for Subsystem 0000000E0325 at Fri Jun 15 02:38:20 2007

。。。。。。。。。。。。。。。。。。。。。。。。。。

Usage record for Subsystem 0000000E0325 at Fri Jun 15 17:24:25 2007

System change record for Subsystem 0000000E0325 at Fri Jun 15 17:24:25 2007
   Controller timestamp   = 2958730
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Usage record for Subsystem 0000000E0325 at Fri Jun 15 17:30:17 2007

Usage record for Subsystem 0000000E0325 at Fri Jun 15 17:39:32 2007

Controller error record for Subsystem 0000000E0325 at Fri Jun 15 17:39:32 2007
   Controller timestamp            = 2958745
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Fri Jun 15 17:39:32 2007
   Controller timestamp   = 2958745
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Usage record for Subsystem 0000000E0325 at Fri Jun 15 17:42:44 2007

Usage record for Subsystem 0000000E0325 at Fri Jun 15 17:43:33 2007

Found 49923 records
    分析可能是A6插槽内的磁盘也有问题,因为空间比较紧张,为了保护用户的数据安全决定再插一
块18GB硬盘进入盘柜。希望增加空间,能够执行rebuild后就可以把A6插槽内的硬盘拔下来了。
但是插入另一块18GB硬盘到A3插槽后。还是不能完成重构。用arraydsp -a命令查看阵列状态,
除了又包括进一块18GB硬盘外,其他信息都和以前一样。
      哪位大侠能够帮忙判断一下,这是什么原因不能rebuild?如果现在把A6拔下来,会不会对用户的
数据造成损坏?如果不会对数据造成破坏,拔下A6插槽内的磁盘后,阵列会不会就能rebuild了?
      有那位大侠能解决这个问题?我这里先谢谢了!
作者: cjhvslhb    时间: 2007-06-16 22:06
联通VOIP项目的机器?

这个问题比较复杂,我需要更多的资料:

1.检查controller和disk enclosure上的指示灯状态;
2.#arraydsp –a <阵列标识号 - ArrayID>;
3.# logprint –t ctrlr,disk,change的信息;

可以交流下.
作者: sz_zte    时间: 2007-06-17 10:58
Disk in slot A1

这个是什么盘,是不是这个盘有问题了,这个盘上面的数据无法同步新盘上面去?

disk1有些问题,导致RAID的部分数据无法重建,所以现在主机是不能访问数据的

正常情况下,坏盘后,有HOTspare,数据是还可以正常访问的

参考
作者: punish01    时间: 2007-06-17 14:05
标题: 老大,有没有解决办法?急!急!急!!!!!
A1插槽没有硬盘
液晶面板上显示 system warning, 其他没有了。以下是arraydsp -a的显示:
   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Array State           = WARNING
   Server name           = smcp01
   Array type            = 3
   Mfg. Product Code     = IJMTU00004

   --- Disk space usage --------------------
   Total physical               = 60782 MB *
   Allocated to LUNs            = 24382 MB *
   Used as Active Hot spare     =  8683 MB *
   Used by non-included disks   =     0 MB *
   Used for Redundancy          = 20088 MB *
   Unallocated (avail for LUNs) =  7629 MB *
   -----------------------------------------

   THE FOLLOWING WARNING(S) EXIST:
   - Data Unavailable
   - Redundancy Loss
   - Rebuild Failed
   - Missing Disk


Standard input   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------

   LUN 0:
   Capacity (MB=2^20) = 100 MB *
   Maximum block addr = 204800
   Block length       = 512

   LUN 1:
   Capacity (MB=2^20) = 8192 MB *
   Maximum block addr = 16777216
   Block length       = 512

   LUN 2:
   Capacity (MB=2^20) = 8112 MB *
   Maximum block addr = 16613376
   Block length       = 512

   LUN 3:
   Capacity (MB=2^20) = 5000 MB *
   Maximum block addr = 10240000
   Block length       = 512

   LUN 4:
   Capacity (MB=2^20) = 2978 MB *
   Maximum block addr = 6098944
   Block length       = 512

   Total capacity allocated to LUNs = 24382 MB *


   Information for disk in slot A4:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39103LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 790700007035
      Firmware revision      = HP01
      Drive ID number        = FFFFFFFD10B9427B
      Volume set serial no.  = 14994       2

   Information for disk in slot B4:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39102LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 374100001924
      Firmware revision      = HP03
      Drive ID number        = FFFFFFFD C611084
      Volume set serial no.  = 14994       2

   Information for disk in slot A5:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39103LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 911100001039
      Firmware revision      = HP02
      Drive ID number        = FFFFFFFD1090AF0F
      Volume set serial no.  = 14994       2

   Information for disk in slot B5:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39102LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 696600001939
      Firmware revision      = HP01
      Drive ID number        = BD99       1
      Volume set serial no.  = 14994       2

   Information for disk in slot A6:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST39103LC
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 168900001040
      Firmware revision      = HP02
      Drive ID number        = FFFFFFFD10A4ED10
      Volume set serial no.  = 14994       2

   Information for disk in slot B6:
      Disk State             = INCLUDED
      Vendor                 = SEAGATE
      Product ID             = ST318404LC
      Capacity               = 17366 MB *
      Max. block addr        = 35566479
      Block length           = 512
      Serial number          = LHE700002151
      Firmware revision      = HP04
      Drive ID number        = FFFFFFFD14000003
      Volume set serial no.  = 14994       2

   Total capacity of all installed physical disks = 60782 MB *

   The following disk is reported MISSING by the controller:
      Vendor                 = SEAGATE
      Product ID             = ST39103LC      
      Capacity               = 8683 MB *
      Max. block addr        = 17783111
      Block length           = 512
      Serial number          = 283600001022
      Disk ID number         = FFFFFFFD1093A7FE
      Volume set serial no.  = 14994       2


   Information for controller X:
      Vendor ID            = HP      
      Product ID           = C5447A         
      Array serial number  = 0000000E0325
      Alias                = VOIP        
      Primary              = FALSE
      SCSI Address         = 1
      Serial number        = R99HADJ843721111
      Paired serial number = R9BJADJ913911111
      Product revision     = HP62


   Information for controller Y:
      Vendor ID            = HP      
      Product ID           = C5447A         
      Array serial number  = 0000000E0325
      Alias                = VOIP        
      Primary              = TRUE
      SCSI Address         = 0
      Serial number        = R9BJADJ913911111
      Paired serial number = R99HADJ843721111
      Product revision     = HP62


   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Overall State of Array          = WARNING
   Array configuration:
      Active Hot Spare Desired     = ENABLED
      Auto Include                 = ENABLED
      Auto Rebuild                 = ENABLED
      Rebuild Priority             = HIGH
      Capacity Depletion Threshold = 0%
      Write Working Set Interval   = 8640 seconds
      Language                     = ENGLISH
      Log Full Warning             = DISABLED
      Volume Set Partitioning      = DISABLED
      Format Pattern Fill          = DISABLED
      Subsystem Type ID            = 12
      LUN Creation Limit           = 8
      Maximum LUN Creation Limit   = 8
   Array SCSI configuration:
      Controller X SCSI Address    = 1
      Controller Y SCSI Address    = 0
      Write Cache                  = ENABLED
      Read Cache                   = DISABLED
      SCSI Parity Checking         = ENABLED
      SDTR                         = ENABLED
      WDTR                         = ENABLED
      Terminator Power             = ENABLED
      Unit Attention               = ENABLED
      Disable Remote Reset         = ENABLED
      Secondary Controller Offline = DISABLED
      Very Early Busy              = DISABLED
      Queue Full Threshold         = 1952
      Maximum Queue Full Threshold = 1952
      Simplified Resiliency Setting = HighPerformance
      Single Controller Warning    = ENABLED
      Lock Write Cache On          = TRUE
      Disable NVRAM on WCE False   = FALSE
      Disable NVRAM with One Ctrlr = TRUE
      Disable NVRAM on UPS absent  = FALSE
      Force Unit Access Response   = 0
      Disable Read Hits            = FALSE
      Resiliency Threshold         = 0

   THE FOLLOWING WARNING(S) EXIST:
   - Data Unavailable
   - Redundancy Loss
   - Rebuild Failed
   - Missing Disk

   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Raid 0/1 blocks       = 469632
   Raid 0/1 block length = 512
   Raid 0/1 capacity     = 229 MB *

   Vendor ID           = HP
   Product ID          = C5447A
   Array serial number = 0000000E0325
   Array alias         = VOIP        
   ----------------------------------------------------
   Fan F1              = GOOD
   Fan F2              = GOOD
   Fan F3              = GOOD
   Power supply PS1    = GOOD
   Power supply PS2    = GOOD
   Power supply PS3    = GOOD

   Controller X:
      Overall state    = GOOD
      Battery #0 state = GOOD
      Battery #1 state = GOOD
      DRAM    #0 state = GOOD
      NVRAM   #0 state = GOOD
      NVRAM   #1 state = GOOD
   Controller Y:
      Overall state    = GOOD
      Battery #0 state = GOOD
      Battery #1 state = GOOD
      DRAM    #0 state = GOOD
      NVRAM   #0 state = GOOD
      NVRAM   #1 state = GOOD
作者: punish01    时间: 2007-06-17 14:38
标题: logprint的输出我看为arraylog命令的输出一样。
主机现在还能访问盘柜上的LUN,应用还正正常运行。
下面有没有好的解决办法,使盘柜能够rebuild? 我觉得首先是应该把missing disk的错误想办法去掉。
作者: punish01    时间: 2007-06-17 15:07
标题: logprint命令的输出
无用并且重复的信息已删除,象这样的信息:

Log File: /var/opt/hparray/log/L0004131

Log File: /var/opt/hparray/log/L0004132

剩下有用的信息

Controller error record for Subsystem 0000000E0325 at Tue Mar  7 23:23:26 2006
   Controller timestamp            = 2345294
   Event code                      = 157
   Event code description          = Correctable Memory Error
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 132
   FRU description                 = First installable SIMM on Controller Y


Log File: /var/opt/hparray/log/L0004133

Log File: /var/opt/hparray/log/L0004134

。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0004206

Log File: /var/opt/hparray/log/L0004207

Controller error record for Subsystem 0000000E0325 at Sat Apr  8 10:42:38 2006
   Controller timestamp            = 2386837
   Event code                      = 157
   Event code description          = Correctable Memory Error
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Log File: /var/opt/hparray/log/L0004208

Log File: /var/opt/hparray/log/L0004209

。。。。。。。。。。。。。。。。。。。
Log File: /var/opt/hparray/log/L0004479

Log File: /var/opt/hparray/log/L0004480

Controller error record for Subsystem 0000000E0325 at Mon Jul 31 09:26:43 2006
   Controller timestamp            = 2537230
   Event code                      = 157
   Event code description          = Correctable Memory Error
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 134
   FRU description                 = Non-Reporting Controller


Log File: /var/opt/hparray/log/L0004481

Controller error record for Subsystem 0000000E0325 at Mon Jul 31 11:26:50 2006
   Controller timestamp            = 2537337
   Event code                      = 199
   Event code description          = Power Supply Failed
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 143
   FRU description                 = Power Supply 3


Log File: /var/opt/hparray/log/L0004482

Log File: /var/opt/hparray/log/L0004483
。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0004620

Log File: /var/opt/hparray/log/L0004621

Controller error record for Subsystem 0000000E0325 at Thu Sep 28 00:55:45 2006
   Controller timestamp            = 2614632
   Event code                      = 157
   Event code description          = Correctable Memory Error
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 132
   FRU description                 = First installable SIMM on Controller Y


Log File: /var/opt/hparray/log/L0004622

Log File: /var/opt/hparray/log/L0004623

。。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0004895

Log File: /var/opt/hparray/log/L0004896

Controller error record for Subsystem 0000000E0325 at Sat Jan 20 15:11:58 2007
   Controller timestamp            = 2765878
   Event code                      = 158
   Event code description          = Memory Compare Error
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 134
   FRU description                 = Non-Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sat Jan 20 15:11:58 2007
   Controller timestamp            = 2765880
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Log File: /var/opt/hparray/log/L0004897

Log File: /var/opt/hparray/log/L0004898

。。。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0004943

Log File: /var/opt/hparray/log/L0004944

Controller error record for Subsystem 0000000E0325 at Fri Feb  9 15:28:29 2007
   Controller timestamp            = 2792298
   Event code                      = 61
   Event code description          = Host SCSI Bus Timeout
   Event count                     = 1
   Component ID                    = 7
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Log File: /var/opt/hparray/log/L0004945

Log File: /var/opt/hparray/log/L0004946

。。。。。。。。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0005006

Log File: /var/opt/hparray/log/L0005007

Controller error record for Subsystem 0000000E0325 at Thu Mar  8 02:40:24 2007
   Controller timestamp            = 2827237
   Event code                      = 166
   Event code description          = Internal SCSI Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Controller error record for Subsystem 0000000E0325 at Thu Mar  8 02:40:24 2007
   Controller timestamp            = 2827238
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Controller error record for Subsystem 0000000E0325 at Thu Mar  8 02:40:24 2007
   Controller timestamp            = 2827238
   Event code                      = 21
   Event code description          = Recovered With Low Level Retries
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Controller error record for Subsystem 0000000E0325 at Thu Mar  8 03:55:28 2007
   Controller timestamp            = 2827316
   Event code                      = 166
   Event code description          = Internal SCSI Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Controller error record for Subsystem 0000000E0325 at Thu Mar  8 03:55:28 2007
   Controller timestamp            = 2827317
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Log File: /var/opt/hparray/log/L0005008

Log File: /var/opt/hparray/log/L0005009

。。。。。。。。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0005067

Log File: /var/opt/hparray/log/L0005068

Controller error record for Subsystem 0000000E0325 at Mon Apr  2 10:05:47 2007
   Controller timestamp            = 2860653
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 3
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Log File: /var/opt/hparray/log/L0005069

Log File: /var/opt/hparray/log/L0005070

。。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0005107

Log File: /var/opt/hparray/log/L0005108

Controller error record for Subsystem 0000000E0325 at Thu Apr 19 05:32:40 2007
   Controller timestamp            = 2882837
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 3
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Log File: /var/opt/hparray/log/L0005109

Log File: /var/opt/hparray/log/L0005110
。。。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0005127

Log File: /var/opt/hparray/log/L0005128

Controller error record for Subsystem 0000000E0325 at Fri Apr 27 15:00:53 2007
   Controller timestamp            = 2893923
   Event code                      = 61
   Event code description          = Host SCSI Bus Timeout
   Event count                     = 1
   Component ID                    = 7
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Fri Apr 27 15:15:54 2007
   Controller timestamp            = 2893941
   Event code                      = 61
   Event code description          = Host SCSI Bus Timeout
   Event count                     = 1
   Component ID                    = 7
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Log File: /var/opt/hparray/log/L0005129

Log File: /var/opt/hparray/log/L0005130

。。。。。。。。。。。。。。。。。。。。。。。。。。
作者: punish01    时间: 2007-06-17 15:10
标题: 接着还有
Log File: /var/opt/hparray/log/L0005148

Log File: /var/opt/hparray/log/L0005149

Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 11
   FRU description                 = Disk in slot B6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 146
   Event code description = Disk Drive Removed
   Event count            = 1
   FRU ID                 = 11
   FRU description        = Disk in slot B6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 208
   Event code description          = Internal SCSI Bus State Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 194
   FRU description                 = ARM StringCatalog::GetStringCommonBuf(17, 195): No such string.

Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 99
   Event code description          = Write Recovered With RAID 5 Redundancy
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 146
   Event code description = Disk Drive Removed
   Event count            = 1
   FRU ID                 = 10
   FRU description        = Disk in slot A6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 178
   Event code description = Data Unavailable
   Event count            = 1
   FRU ID                 = 129
   FRU description        = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 79
   Event code description          = Check Condition From Disk Drive With No Sense
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 44
   Event code description          = Unavailable Data Detected By RAID 1
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Disk error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp             = 2905208
   Event code                       = 232
   Event code description           = Data loss detected on LUN (identified by ASC)
   Event count                      = 1
   FRU number                       = 0
   FRU description                  = Disk in slot A1

   Slot number                      = A1
   Sense key                        = 0x0
   Additional Sense code            = 0x1
   Additional Sense code qualifier  = 0x80
   LBA                              = 59008

System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905208
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 44
   Event code description          = Unavailable Data Detected By RAID 1
   Event count                     = 15
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 208
   Event code description          = Internal SCSI Bus State Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Event code                      = 192
   Event code description          = Internal SCSI Timeout Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 194
   FRU description                 = ARM StringCatalog::GetStringCommonBuf(17, 195): No such string.

Controller error record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp            = 2905208
   Module Number                   = 1
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller

   Abnormal termination code (hex) = 16 a
作者: punish01    时间: 2007-06-17 15:11
标题: logprint命令输出的最后一部分
System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 144
   Event code description = Disk Drive Installed
   Event count            = 1
   FRU ID                 = 10
   FRU description        = Disk in slot A6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 219
   Event code description = Member Disk Drive Added Back Into Disk Set
   Event count            = 1
   FRU ID                 = 10
   FRU description        = Disk in slot A6


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 186
   Event code description = Drive Missing At Power On
   Event count            = 1
   FRU ID                 = 129
   FRU description        = Reporting Controller


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 178
   Event code description = Data Unavailable
   Event count            = 1
   FRU ID                 = 129
   FRU description        = Reporting Controller


System change record for Subsystem 0000000E0325 at Sun May  6 04:14:57 2007
   Controller timestamp   = 2905209
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sun May  6 04:29:58 2007
   Controller timestamp            = 2905225
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Sun May  6 04:29:58 2007
   Controller timestamp   = 2905226
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Log File: /var/opt/hparray/log/L0005150

Log File: /var/opt/hparray/log/L0005151
。。。。。。。。。。。。。。。。。。。。。。。。

Log File: /var/opt/hparray/log/L0005243

Log File: /var/opt/hparray/log/L0005244

System change record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp   = 2957665
   Event code             = 144
   Event code description = Disk Drive Installed
   Event count            = 1
   FRU ID                 = 11
   FRU description        = Disk in slot B6


System change record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp   = 2957665
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


System change record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp   = 2957665
   Event code             = 145
   Event code description = Disk Drive Added To Disk Set
   Event count            = 1
   FRU ID                 = 11
   FRU description        = Disk in slot B6


Controller error record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp            = 2957667
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Thu Jun 14 22:08:02 2007
   Controller timestamp   = 2957669
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Log File: /var/opt/hparray/log/L0005245

Controller error record for Subsystem 0000000E0325 at Fri Jun 15 01:38:16 2007
   Controller timestamp            = 2957858
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Fri Jun 15 02:08:18 2007
   Controller timestamp            = 2957886
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Fri Jun 15 02:23:19 2007
   Controller timestamp            = 2957895
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 2
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Log File: /var/opt/hparray/log/L0005246

System change record for Subsystem 0000000E0325 at Fri Jun 15 17:24:25 2007
   Controller timestamp   = 2958730
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Fri Jun 15 17:39:32 2007
   Controller timestamp            = 2958745
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Fri Jun 15 17:39:32 2007
   Controller timestamp   = 2958745
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Log File: /var/opt/hparray/log/L0005247

Log File: /var/opt/hparray/log/L0005248

Controller error record for Subsystem 0000000E0325 at Sat Jun 16 09:40:37 2007
   Controller timestamp            = 2959626
   Event code                      = 96
   Event code description          = Read Recovered With RAID 5 Retries
   Event count                     = 4
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp            = 2959627
   Event code                      = 29
   Event code description          = Disk Drive Failed Initialization
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 0
   FRU description                 = Disk in slot A1


System change record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp   = 2959627
   Event code             = 144
   Event code description = Disk Drive Installed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Disk error record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp             = 2959629
   Event code                       = 24
   Event code description           = Disk Drive Hardware Error
   Event count                      = 1
   FRU number                       = 0
   FRU description                  = Disk in slot A1

   Slot number                      = A1
   Sense key                        = 0x4
   Additional Sense code            = 0x2
   Additional Sense code qualifier  = 0x0
   LBA                              = 0

System change record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp   = 2959633
   Event code             = 185
   Event code description = Non-Member Drive Removed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp            = 2959633
   Event code                      = 96
   Event code description          = Read Recovered With RAID 5 Retries
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp   = 2959634
   Event code             = 144
   Event code description = Disk Drive Installed
   Event count            = 1
   FRU ID                 = 4
   FRU description        = Disk in slot A3


System change record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp   = 2959634
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


System change record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp   = 2959634
   Event code             = 145
   Event code description = Disk Drive Added To Disk Set
   Event count            = 1
   FRU ID                 = 4
   FRU description        = Disk in slot A3


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp            = 2959634
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp   = 2959634
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


System change record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp   = 2959636
   Event code             = 137
   Event code description = Rebuild Started
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp            = 2959636
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


System change record for Subsystem 0000000E0325 at Sat Jun 16 09:55:39 2007
   Controller timestamp   = 2959636
   Event code             = 140
   Event code description = Rebuild Failed
   Event count            = 1
   FRU ID                 = 0
   FRU description        = Disk in slot A1


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 11:10:44 2007
   Controller timestamp            = 2959700
   Event code                      = 166
   Event code description          = Internal SCSI Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 11:10:44 2007
   Controller timestamp            = 2959700
   Event code                      = 96
   Event code description          = Read Recovered With RAID 5 Retries
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 11:10:44 2007
   Controller timestamp            = 2959701
   Event code                      = 166
   Event code description          = Internal SCSI Event
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 11:10:44 2007
   Controller timestamp            = 2959701
   Event code                      = 21
   Event code description          = Recovered With Low Level Retries
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 10
   FRU description                 = Disk in slot A6


Log File: /var/opt/hparray/log/L0005249

Controller error record for Subsystem 0000000E0325 at Sat Jun 16 19:56:21 2007
   Controller timestamp            = 2960188
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 1
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Controller error record for Subsystem 0000000E0325 at Sat Jun 16 20:11:22 2007
   Controller timestamp            = 2960197
   Event code                      = 39
   Event code description          = Unavailable Data Detected By RAID 5
   Event count                     = 3
   Component ID                    = 6
   FRU ID                          = 129
   FRU description                 = Reporting Controller


Log File: /var/opt/hparray/log/L0005250

Log File: /var/opt/hparray/log/L0005251

Found 87 records
作者: cjhvslhb    时间: 2007-06-17 17:48
没有太好的办法,在你之前估计还有牛人搞过.

1.把所有拔出的硬盘全部插回去;
2.按照反复INCLUDE大法看能不能认到坏盘;
3.不行就只有FORMAT掉,恢复备份了.
作者: punish01    时间: 2007-06-17 19:00
标题: 有一个疑问,请各位高手帮我!
原来坏盘的位置B6现在已被一个18GB的硬盘占了,并且已经被include了。
我是直接把坏盘插到阵列中的任何一个空插槽呢?还是把现在B6插槽内的18GB硬盘先down了,
再把坏盘插回原来的B6位置?
还有就是盘已经坏了,即使插回去,阵列还很可能会把这个硬盘识别为已坏。这对阵列的恢复有什么
帮助吗?
作者: cjhvslhb    时间: 2007-06-17 23:16
Recovering From Multiple Write Failed Disks in a LUN

The procedures for reviving a Dead LUN, differ slightly depending on whether the RAID level is 1 or 5.  In all cases, it warns that Unfail should only be used on the LAST drive that was marked as failed, which, if unfailed, would transition the LUN from Dead to Degraded.  The remainder of the failed drives should be changed from Failed to Replaced--not Unfailed.  To do otherwise is to risk loss of data integrity

总的来说:
1.你现在主要的问题不是Rebuild Failed,是Data Unavailable;这个你必须认识清楚;
2.手工REBUILD到99%,应用能访问证明LOST的部分数据不多.但是关键是阵列现在所处的状态是个很不稳定的状态;如果继续运行下去会有更严重的后果.最好的办法当然是趁现在数据在的时候备份重建.
3.硬盘坏有几种方式;有时候是因为硬盘的读写错误次数超过规定的阀值;
4.磁盘插回去任何一个空位就好了.
5.这个方法不过聊尽人事而已,成功的几率不超过10%.

[ 本帖最后由 cjhvslhb 于 2007-6-19 13:54 编辑 ]
作者: punish01    时间: 2007-06-18 20:40
标题: 原来B6位置已被占怎么办?
原来B6位置的插槽已被一块18G的新盘占了,原来的坏盘(9GB)是插回B6插槽,还是随意插到一个空
的插槽就行了。
如果要插回原插槽,就要把现在B6插槽内的硬盘删掉并拔掉。比较危险。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2