免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1590 | 回复: 3
打印 上一主题 下一主题

紧急求助:V880用DISKSUITE做陈列的一块硬盘坏,导致ORACLE APP无法启动 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-01-30 13:45 |只看该作者 |倒序浏览
新年上班第一天,就发现ORACLE启动不了,查看
#more /var/adm/messages发现提示

Jan 28 07:03:55 granden1 qlc: [ID 686697 kern.info] NOTICE: Qlogic qlc(0): Loop OFFLINE
Jan 28 07:03:58 granden1 qlc: [ID 686697 kern.info] NOTICE: Qlogic qlc(0): Loop ONLINE
Jan 28 07:03:58 granden1 scsi: [ID 107833 kern.warning] WARNING: /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda14ca,0 (ssd3):
Jan 28 07:03:58 granden1        Error for Command: write(10)               Error Level: Retryable
Jan 28 07:03:58 granden1 scsi: [ID 107833 kern.notice]  Requested Block: 43                        Error Block: 43
Jan 28 07:03:58 granden1 scsi: [ID 107833 kern.notice]  Vendor: SEAGATE                            Serial Number: 0249B0FP4D  
Jan 28 07:03:58 granden1 scsi: [ID 107833 kern.notice]  Sense Key: Hardware Error
Jan 28 07:03:58 granden1 scsi: [ID 107833 kern.notice]  ASC: 0x19 (defect list error), ASCQ: 0x0, FRU: 0x7
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.warning] WARNING: /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda14ca,0 (ssd3):
Jan 28 07:04:02 granden1        Error for Command: write(10)               Error Level: Retryable
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.notice]  Requested Block: 64606912                  Error Block: 64606912
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.notice]  Vendor: SEAGATE                            Serial Number: 0249B0FP4D  
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.notice]  Sense Key: Media Error
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.notice]  ASC: 0x31 (medium format corrupted), ASCQ: 0x0, FRU: 0x5
Jan 28 07:04:02 granden1 scsi: [ID 243001 kern.warning] WARNING: /pci@8,600000/SUNW,qlc@2/fp@0,0 (fcp0):
Jan 28 07:04:02 granden1        FCP: WWN 0x21000004cfda14ca reset successfully
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.warning] WARNING: /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda14ca,0 (ssd3):
Jan 28 07:04:02 granden1        Error for Command: write(10)               Error Level: Retryable
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.notice]  Requested Block: 64606912                  Error Block: 64606912
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.notice]  Vendor: SEAGATE                            Serial Number: 0249B0FP4D  
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.notice]  Sense Key: Media Error
Jan 28 07:04:02 granden1 scsi: [ID 107833 kern.notice]  ASC: 0x31 (medium format corrupted), ASCQ: 0x0, FRU: 0x5
Jan 28 07:04:03 granden1 scsi: [ID 243001 kern.warning] WARNING: /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda14ca,0 (ssd3):
Jan 28 07:04:03 granden1        SCSI transport failed: reason 'reset': retrying command
Jan 28 07:04:04 granden1 scsi: [ID 243001 kern.warning] WARNING: /pci@8,600000/SUNW,qlc@2/fp@0,0 (fcp0):
Jan 28 07:04:04 granden1        FCP: WWN 0x21000004cfda14ca reset successfully
Jan 28 07:04:04 granden1 scsi: [ID 107833 kern.warning] WARNING: /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda14ca,0 (ssd3):
Jan 28 07:04:04 granden1        Error for Command: write(10)               Error Level: Retryable
Jan 28 07:04:04 granden1 scsi: [ID 107833 kern.notice]  Requested Block: 43                        Error Block: 43
Jan 28 07:04:04 granden1 scsi: [ID 107833 kern.notice]  Vendor: SEAGATE                            Serial Number: 0249B0FP4D  

#format
Searching for disks...done
AVAILABLE DISK SELECTIONS:
       0. c1t0d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda2aaf,0
       1. c1t1d0 <drive type unknown>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda14ca,0
       2. c1t2d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda2cf0,0
       3. c1t3d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w500000e0100ecdc1,0
       4. c1t4d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda232b,0
       5. c1t5d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w21000004cfda188c,0
       6. c1t8d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w500000e01026d901,0
       7. c1t9d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w500000e01026d921,0
       8. c1t10d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w500000e01026d8f1,0
       9. c1t11d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w500000e01026ccd1,0
      10. c1t12d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w500000e01026bd31,0
      11. c1t13d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
          /pci@8,600000/SUNW,qlc@2/fp@0,0/ssd@w500000e0102727f1,0
将服务器冷关闭后,将c1t1d0这块硬盘拔出,再开机,提示/dev/md/rdsk/d0陈列有误,直接按Ctrl+D后进入系统,运行
#metastat提示
bash-2.03# metastat
d0: Mirror
    Submirror 0: d1
      State: Needs maintenance
    Submirror 1: d2
      State: Needs maintenance
    Pass: 1
    Read option: roundrobin (default)
    Write option: parallel (default)
    Size: 143339136 blocks

d1: Submirror of d0
    State: Needs maintenance
    Invoke: after replacing "Maintenance" components:
                metareplace d0 c1t1d0s2 <new device>
    Size: 143339136 blocks
    Stripe 0:
        Device              Start Block  Dbase State        Hot Spare
        c1t1d0s2               10176     No    Last Erred   


d2: Submirror of d0
    State: Needs maintenance
    Invoke: metareplace d0 c1t2d0s2 <new device>
    Size: 143339136 blocks
    Stripe 0:
        Device              Start Block  Dbase State        Hot Spare
        c1t2d0s2               10176     Yes   Maintenance  

手头没有多余的72G硬盘,而且我对SUN不是很熟,请问有没有办法直接将/d01 mount起来

#bash-2.03# more /etc/vfstab
#device         device          mount           FS      fsck    mount   mount
#to mount       to fsck         point           type    pass    at boot options
#
#/dev/dsk/c1d0s2 /dev/rdsk/c1d0s2 /usr          ufs     1       yes     -
# fd    -       /dev/fd fd      -       no      -
/proc   -       /proc   proc    -       no      -
/dev/md/dsk/d20 -       -       swap    -       no      -
/dev/md/dsk/d100        /dev/md/rdsk/d100       /       ufs     1       no      logging
/dev/md/dsk/d0  /dev/md/rdsk/d0 /d01    ufs     1       yes     logging
/dev/md/dsk/d3  /dev/md/rdsk/d3 /d04    ufs     1       yes     logging
/dev/md/dsk/d6  /dev/md/rdsk/d6 /d03    ufs     1       yes     logging
/dev/md/dsk/d9  /dev/md/rdsk/d9 /d05    ufs     1       yes     logging
# /dev/md/dsk/d12       /dev/md/rdsk/d12        /d05    ufs     1       yes     -

万分感谢!

论坛徽章:
0
2 [报告]
发表于 2012-01-30 16:28 |只看该作者
把如下命令的信息贴出来
metastat -p
metadb
metadb -i
metastat -t
iostat -En
df -k

信息显示c1t1d0和c1t2d0可能都有问题了

论坛徽章:
0
3 [报告]
发表于 2012-01-30 16:38 |只看该作者
把有问题的metadb删除了,重启机器再看看情况

论坛徽章:
0
4 [报告]
发表于 2012-01-31 10:55 |只看该作者
多谢各位的热心帮忙,经过检测,确实是c1t1d0和c1t2d0两块硬盘同时坏了,无奈之下,废弃了此两块硬盘的陈列,将备份的数据还原到另一个磁盘陈列,然后作软链接后,重启数据库和应用程序后正常,非常感谢!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP