solphin 发表于 2011-10-29 03:40

sun cluster更换主板后无法启动 。。。

0} ok boot -x
Boot device: /pci@780/pci@0/pci@9/scsi@0/disk@0File and args: -x
SunOS Release 5.10 Version Generic_118833-20 64-bit
Copyright 1983-2006 Sun Microsystems, Inc.All rights reserved.
Use is subject to license terms.
Hostname: ws
device id for '/dev/rdsk/c0t0d0' does not match physical disk's id.
The drive may have been replaced
device id for '/dev/rdsk/c0t2d0' does not match physical disk's id.
The drive may have been replaced
Not booting as part of a cluster
device id for '/dev/rdsk/c0t0d0' does not match physical disk's id.
The drive may have been replaced
device id for '/dev/rdsk/c0t2d0' does not match physical disk's id.
The drive may have been replaced
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Fatal
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
checking ufs filesystems
/dev/rdsk/c0t0d0s6: is logging.
/dev/rdsk/c0t2d0s5: is logging.
/dev/rdsk/c0t0d0s5: is logging.
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Fatal
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
/dev/rdsk/c0t2d0s4: CANNOT READ: DISK BLOCK 16: I/O error
/dev/rdsk/c0t2d0s4: UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY.
/dev/rdsk/c0t2d0s6: is logging.

THE FOLLOWING FILE SYSTEM(S) HAD AN UNEXPECTED INCONSISTENCY: /dev/rdsk/c0t2d0s4 (/osp/delivery)
fsckall failed with exit code 1.

WARNING - Unable to repair one or more filesystems.
Run fsck manually (fsck filesystem...).

WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
/pci@780/pci@0/pci@9/scsi@0 (mpt0):
      mpt_flush_target discovered non-NULL cmd in slot 478, tasktype 0x3WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      SCSI transport failed: reason 'reset': retrying command

WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0 (mpt0):
      NULL command returned as context reply in slot 478
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Retryable
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
WARNING: /pci@780/pci@0/pci@9/scsi@0/sd@2,0 (sd4):
      Error for Command: read                  Error Level: Fatal
      Requested Block: 16                        Error Block: 16
      Vendor: LSILOGIC                           Serial Number: LSI Internal
      Sense Key: Media Error
      ASC: 0x11 (read retries exhausted), ASCQ: 0x1, FRU: 0x0
svc:/system/filesystem/local:default: WARNING: /sbin/mountall -l failed: exit status 1
Oct 29 01:50:06 svc.startd: svc:/system/filesystem/local:default: Method "/lib/svc/method/fs-local" failed with exit status 95.
[ system/filesystem/local:default failed fatally (see 'svcs -x' for details) ]


各位大侠,SF T2000+sun cluster 3.2+3320做的双机,更换完第二胎机器的主板之后报如上的错误。这是什么原因导致的,求救。

wsroot#raidctl -l
RAID    VolumeRAID            RAID            Disk
VolumeType    Status          Disk            Status
------------------------------------------------------
c0t2d0IM      OK            c0t2d0          OK
                              c0t3d0          OK
c0t0d0IM      OK            c0t0d0          OK
                              c0t1d0          OK



wsroot#format
Searching for disks...done


AVAILABLE DISK SELECTIONS:
       0. c0t0d0 <LSILOGIC-LogicalVolume-3000 cyl 65533 alt 2 hd 16 sec 136>
          /pci@780/pci@0/pci@9/scsi@0/sd@0,0
       1. c0t2d0 <LSILOGIC-LogicalVolume-3000 cyl 65533 alt 2 hd 16 sec 136>
          /pci@780/pci@0/pci@9/scsi@0/sd@2,0
       2. c2t0d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@1/sd@0,0
       3. c2t1d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@1/sd@1,0
       4. c2t2d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@1/sd@2,0
       5. c2t3d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@1/sd@3,0
       6. c2t4d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@1/sd@4,0
       7. c3t0d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@2/sd@0,0
       8. c3t1d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@2/sd@1,0
       9. c3t2d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@2/sd@2,0
      10. c3t3d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@2/sd@3,0
      11. c3t4d0 <drive not available: reserved>
          /pci@7c0/pci@0/pci@1/pci@0,2/scsi@2/sd@4,0
Specify disk (enter its number): 0


ws root#scdidadm -l
4      wsdp2:/dev/rdsk/c2t0d0         /dev/did/rdsk/d4   
5      wsdp2:/dev/rdsk/c2t1d0         /dev/did/rdsk/d5   
6      wsdp2:/dev/rdsk/c2t2d0         /dev/did/rdsk/d6   
7      wsdp2:/dev/rdsk/c2t3d0         /dev/did/rdsk/d7   
8      wsdp2:/dev/rdsk/c2t4d0         /dev/did/rdsk/d8   
9      wsdp2:/dev/rdsk/c3t0d0         /dev/did/rdsk/d9   
10       wsdp2:/dev/rdsk/c3t1d0         /dev/did/rdsk/d10   
11       wsdp2:/dev/rdsk/c3t2d0         /dev/did/rdsk/d11   
12       wsdp2:/dev/rdsk/c3t3d0         /dev/did/rdsk/d12   
13       wsdp2:/dev/rdsk/c3t4d0         /dev/did/rdsk/d13   
14       wsdp2:/dev/rdsk/c0t0d0         /dev/did/rdsk/d14   
15       wsdp2:/dev/rdsk/c0t2d0         /dev/did/rdsk/d15   
16       wsdp2:/dev/rdsk/c1t0d0         /dev/did/rdsk/d16

财版 发表于 2011-10-29 12:15

先probe-scsi-all看看你的盘识别到了没有。

solphin 发表于 2011-10-29 12:36

回复 2# 财版


    0} ok probe-scsi-all
/pci@7c0/pci@0/pci@1/pci@0,2/scsi@2
Target 0
Unit 0   Disk   SEAGATE ST373207LSUN72G 045A    143374738 Blocks, 70007 MB
Target 1
Unit 0   Disk   SEAGATE ST373207LSUN72G 045A    143374738 Blocks, 70007 MB
Target 2
Unit 0   Disk   SEAGATE ST373207LSUN72G 045A    143374738 Blocks, 70007 MB
Target 3
Unit 0   Disk   SEAGATE ST373207LSUN72G 045A    143374738 Blocks, 70007 MB
Target 4
Unit 0   Disk   SEAGATE ST373207LSUN72G 045A    143374738 Blocks, 70007 MB
Target f
Unit 0   Processor   SUN   StorEdge 3320D1180

/pci@7c0/pci@0/pci@1/pci@0,2/scsi@1
Target 0
Unit 0   Disk   HITACHI HUS10733ASUN72G PA05    143374738 Blocks, 70007 MB
Target 1
Unit 0   Disk   HITACHI HUS10733ASUN72G PA05    143374738 Blocks, 70007 MB
Target 2
Unit 0   Disk   HITACHI HUS10733ASUN72G PA05    143374738 Blocks, 70007 MB
Target 3
Unit 0   Disk   HITACHI HUS10733ASUN72G PA05    143374738 Blocks, 70007 MB
Target 4
Unit 0   Disk   HITACHI HUS10733ASUN72G PA05    143374738 Blocks, 70007 MB
Target f
Unit 0   Processor   SUN   StorEdge 3320D1180

/pci@780/pci@0/pci@9/scsi@0

MPT Version 1.05, Firmware Version 1.09.00.00

Target 0 Volume 1
Unit 0   Disk   LSILOGICLogical Volume3000    143112591 Blocks, 73 GB
Target 2 Volume 0
Unit 0   Disk   LSILOGICLogical Volume3000    143112591 Blocks, 73 GB
刚开始换完主板之后没有识别到,但是激活之后全部识别到了。

东方蜘蛛 发表于 2011-10-29 13:19

连线及PCI卡都接的没问题?

solphin 发表于 2011-10-29 13:29

回复 4# 东方蜘蛛


    没有问题,蜘蛛大侠,更换完有过确认,我觉得现在就是硬件raid出问题了,两边数据没同步。导致c0t2d0s4这个分区挂不上。但是硬件raid的状态全部是ok的。不知道能不能拔一块盘出来重新同步?

zyl555 发表于 2011-10-30 21:27

fsck修复一下s4就不行了嘛?

zhmzhouming 发表于 2011-10-31 09:34

连线应该是没问题的,不然第一个RAID应该不会认出来,不会能从c0t0d0启动。

建议修复下看看?
页: [1]
查看完整版本: sun cluster更换主板后无法启动 。。。