Chinaunix

标题: T3--(OK) [打印本页]

作者: klaude    时间: 2010-04-02 12:48
标题: T3--(OK)
本帖最后由 klaude 于 2010-04-19 22:00 编辑

T3,u2d04之前更换过,但是还是显示黄灯。
  1. T3B Release 3.1.4 Thu Apr 15 18:13:32 PDT 2004 (10.34.223.164)
  2. Copyright (C) 1997-2003 Sun Microsystems, Inc.
  3. All Rights Reserved.

  4. t3a:/:<1>fru list
  5. ID      TYPE               VENDOR       MODEL        REVISION       SERIAL
  6. ------  -----------------  -----------  -----------  -------------  --------
  7. u1ctr   controller card    0x301        5015710      54             122512
  8. u2ctr   controller card    0x301        5015710      54             127969
  9. u1d01   disk drive         FUJITSU      MAN3735F SUN 1504           31V18186
  10. u1d02   disk drive         SEAGATE      ST373405FSUN A338           3EK0M8QT
  11. u1d03   disk drive         FUJITSU      MAN3735F SUN B704           30V15954
  12. u1d04   disk drive         HITACHI      DK32EJ72FSUN 2Q09           11W0VY8Z
  13. u1d05   disk drive         SEAGATE      ST173404FSUN AA27           3CE0M5XB
  14. u1d06   disk drive         FUJITSU      MAN3735F SUN 1504           31V18760
  15. u1d07   disk drive         SEAGATE      ST373405FSUN A838           3EK186FG
  16. u1d08   disk drive         FUJITSU      MAN3735F SUN 1504           31V18343
  17. u1d09   disk drive         FUJITSU      MAN3735F SUN 1504           31V19020
  18. u2d01   disk drive         FUJITSU      MAN3735F SUN 1504           32V21761
  19. u2d02   disk drive         FUJITSU      MAN3735F SUN 1504           31V19037
  20. u2d03   disk drive         SEAGATE      ST373405FSUN A338           3EK0LZ5J
  21. u2d04   disk drive         -            -            -              -
  22. u2d05   disk drive         FUJITSU      MAN3735F SUN 1504           30V14809
  23. u2d06   disk drive         FUJITSU      MAN3735F SUN 1504           31V18997
  24. u2d07   disk drive         SEAGATE      ST373207FSUN A55A           3532CKX2
  25. u2d08   disk drive         FUJITSU      MAN3735F SUN 1504           32V20055
  26. u2d09   disk drive         FUJITSU      MAN3735F SUN 1504           31V17935
复制代码
=========================================================
  1. t3a:/:<2>fru stat
  2. CTLR    STATUS   STATE       ROLE        PARTNER    TEMP
  3. ------  -------  ----------  ----------  -------    ----
  4. u1ctr   ready    enabled     master      u2ctr      37
  5. u2ctr   ready    enabled     alt master  u1ctr      32

  6. DISK    STATUS   STATE       ROLE        PORT1      PORT2      TEMP  VOLUME
  7. ------  -------  ----------  ----------  ---------  ---------  ----  ------
  8. u1d01   ready    enabled     data disk   ready      ready      39    v0
  9. u1d02   ready    enabled     data disk   ready      ready      37    v0
  10. u1d03   ready    enabled     data disk   ready      ready      36    v0
  11. u1d04   ready    enabled     data disk   ready      ready      37    v0
  12. u1d05   ready    enabled     data disk   ready      ready      42    v0
  13. u1d06   ready    enabled     data disk   ready      ready      37    v0
  14. u1d07   ready    enabled     data disk   ready      ready      36    v0
  15. u1d08   ready    enabled     data disk   ready      ready      37    v0
  16. u1d09   ready    enabled     standby     ready      ready      34    v0
  17. u2d01   ready    enabled     data disk   ready      ready      36    v1
  18. u2d02   ready    enabled     data disk   ready      ready      38    v1
  19. u2d03   ready    enabled     data disk   ready      ready      36    v1
  20. u2d04   fault    disabled   
  21. u2d05   ready    enabled     data disk   ready      ready      38    v1
  22. u2d06   ready    enabled     data disk   ready      ready      38    v1
  23. u2d07   ready    enabled     data disk   ready      ready      34    v1
  24. u2d08   ready    enabled     data disk   ready      ready      39    v1
  25. u2d09   ready    enabled     standby     ready      ready      35    v1
复制代码
而后再次更换u2d04,先等待u2d09重构结束,然后u2d04接着重构,结果日志提示:
  1. Mar 26 11:49:53 ISR1[2]: N: u2d04 sid 77167 stype 2024 disk error 3
  2. Mar 26 11:52:34 ISR1[2]: N: u2d04 sid 793987 stype 2024 disk error 3
  3. Mar 26 11:52:34 ISR1[2]: N: u2d04 sid 37271 stype 2024 disk error 3
  4. Mar 26 11:52:34 ISR1[2]: N: u2d04 sid 794073 stype 2024 disk error 3
  5. Mar 26 12:01:39 ISR1[2]: N: u2d04 sid 797491 stype 2024 disk error 3
  6. Mar 26 12:06:34 ISR1[2]: N: u2d04 sid 77168 stype 2024 disk error 3
  7. Mar 26 12:15:59 ISR1[2]: N: u2d04 sid 77169 stype 2024 disk error 3
  8. Mar 26 12:15:59 ISR1[2]: N: u2d04 sid 77169 stype 2024 disk error 3
  9. Mar 26 12:25:24 ISR1[2]: N: u2d04 sid 77170 stype 2024 disk error 3
  10. Mar 26 12:37:24 ISR1[2]: N: u2d04 sid 714690 stype 2024 disk error 3
  11. Mar 26 12:41:55 ISR1[2]: N: u2d04 sid 453888 stype 2024 disk error 3
  12. Mar 26 12:47:12 ISR1[2]: N: u2d04 sid 1000029 stype 2024 disk error 3
  13. Mar 26 12:51:21 ISR1[2]: N: u2d04 sid 77171 stype 2024 disk error 3
  14. Mar 26 12:54:26 ISR1[2]: N: u2d04 sid 76285 stype 2024 disk error 3
  15. Mar 26 12:54:26 ISR1[2]: N: u2d04 sid 76285 stype 2024 disk error 3
  16. Mar 26 13:06:52 ISR1[2]: N: u2d04 sid 77173 stype 2024 disk error 3
  17. Mar 26 13:06:52 ISR1[2]: N: u2d04 sid 77173 stype 2024 disk error 3
  18. Mar 26 13:06:52 ISR1[2]: N: u2d04 sid 77173 stype 2024 disk error 3
  19. Mar 26 13:44:20 ISR1[2]: N: u2d04 sid 39259 stype 2024 disk error 3
  20. Mar 26 13:51:51 LT01[1]: N: u2d04 Reconstruction failed
  21. Mar 26 13:51:51 LT01[1]: W: u2d04 Recon attempt failed
  22. Mar 26 13:51:51 LT01[1]: N: u1ctr LT_TASK 1 LT_OP Disk Plug succeeded
  23. Mar 26 13:50:54 ISR1[2]: W: u2d03 SCSI Disk Error Occurred (path = 0x1)
  24. Mar 26 13:50:54 ISR1[2]: W: u2d03 Sense Key = 0x3, Asc = 0x11, Ascq = 0x0
  25. Mar 26 13:50:54 ISR1[2]: W: u2d03 Sense Data Description = Unrecovered Read Error
  26. Mar 26 13:50:54 ISR1[2]: W: u2d03 Valid Information = 0x8896176
  27. Mar 26 13:50:54 ISR1[2]: N: u2d03 SVD_DONE: Command Error = 0x3
  28. Mar 26 13:50:54 ISR1[2]: N: u2d03 sid 2231407 stype 1003 disk error 3
  29. Mar 26 13:50:54 SX11[2]: W: u2ctr read failed during recon stripe scb=c68a2c
  30. Mar 26 13:50:54 SX11[2]: N: u2ctr Internal Command error (Multiple Disk Failed)
  31. Mar 26 13:50:54 SX11[2]: N: u2ctr Internal Command error (Terminated by system)
  32. Mar 26 13:50:54 LNXT[2]: W: u2ctr recon failed in vol (v1)
复制代码
再看状态:
  1. t3a:/:<1>fru list
  2. ID      TYPE               VENDOR       MODEL        REVISION       SERIAL
  3. ------  -----------------  -----------  -----------  -------------  --------
  4. u1ctr   controller card    0x301        5015710      54             122512
  5. u2ctr   controller card    0x301        5015710      54             127969
  6. u1d01   disk drive         FUJITSU      MAN3735F SUN 1504           31V18186
  7. u1d02   disk drive         SEAGATE      ST373405FSUN A338           3EK0M8QT
  8. u1d03   disk drive         FUJITSU      MAN3735F SUN B704           30V15954
  9. u1d04   disk drive         HITACHI      DK32EJ72FSUN 2Q09           11W0VY8Z
  10. u1d05   disk drive         SEAGATE      ST173404FSUN AA27           3CE0M5XB
  11. u1d06   disk drive         FUJITSU      MAN3735F SUN 1504           31V18760
  12. u1d07   disk drive         SEAGATE      ST373405FSUN A838           3EK186FG
  13. u1d08   disk drive         FUJITSU      MAN3735F SUN 1504           31V18343
  14. u1d09   disk drive         FUJITSU      MAN3735F SUN 1504           31V19020
  15. u2d01   disk drive         FUJITSU      MAN3735F SUN 1504           32V21761
  16. u2d02   disk drive         FUJITSU      MAN3735F SUN 1504           31V19037
  17. u2d03   disk drive         SEAGATE      ST373405FSUN A338           3EK0LZ5J
  18. u2d04   disk drive         SEAGATE      ST373405FSUN A338           3EKYMVSG
  19. u2d05   disk drive         FUJITSU      MAN3735F SUN 1504           30V14809
  20. u2d06   disk drive         FUJITSU      MAN3735F SUN 1504           31V18997
  21. u2d07   disk drive         SEAGATE      ST373207FSUN A55A           3532CKX2
  22. u2d08   disk drive         FUJITSU      MAN3735F SUN 1504           32V20055
  23. u2d09   disk drive         FUJITSU      MAN3735F SUN 1504           31V17935
复制代码
=========================================================
  1. t3a:/:<2>fru stat
  2. CTLR    STATUS   STATE       ROLE        PARTNER    TEMP
  3. ------  -------  ----------  ----------  -------    ----
  4. u1ctr   ready    enabled     master      u2ctr      33
  5. u2ctr   ready    enabled     alt master  u1ctr      27

  6. DISK    STATUS   STATE       ROLE        PORT1      PORT2      TEMP  VOLUME
  7. ------  -------  ----------  ----------  ---------  ---------  ----  ------
  8. u1d01   ready    enabled     data disk   ready      ready      34    v0
  9. u1d02   ready    enabled     data disk   ready      ready      33    v0
  10. u1d03   ready    enabled     data disk   ready      ready      32    v0
  11. u1d04   ready    enabled     data disk   ready      ready      32    v0
  12. u1d05   ready    enabled     data disk   ready      ready      38    v0
  13. u1d06   ready    enabled     data disk   ready      ready      33    v0
  14. u1d07   ready    enabled     data disk   ready      ready      32    v0
  15. u1d08   ready    enabled     data disk   ready      ready      33    v0
  16. u1d09   ready    enabled     standby     ready      ready      29    v0
  17. u2d01   ready    enabled     data disk   ready      ready      32    v1
  18. u2d02   ready    enabled     data disk   ready      ready      33    v1
  19. u2d03   ready    enabled     data disk   ready      ready      32    v1
  20. u2d04   ready    disabled    data disk   ready      ready      31    v1
  21. u2d05   ready    enabled     data disk   ready      ready      32    v1
  22. u2d06   ready    enabled     data disk   ready      ready      32    v1
  23. u2d07   ready    enabled     data disk   ready      ready      29    v1
  24. u2d08   ready    enabled     data disk   ready      ready      35    v1
  25. u2d09   ready    enabled     standby     ready      ready      29    v1
复制代码
=====================================================
  1. t3a:/:<3>vol stat

  2. v0: mounted
  3.   u1d01: mounted
  4.   u1d02: mounted
  5.   u1d03: mounted
  6.   u1d04: mounted
  7.   u1d05: mounted
  8.   u1d06: mounted
  9.   u1d07: mounted
  10.   u1d08: mounted
  11.   Standby: u1d09: mounted
  12. v1: mounted
  13.   u2d01: mounted
  14.   u2d02: mounted
  15.   u2d03: mounted
  16.   u2d04: unmounted
  17.   u2d05: mounted
  18.   u2d06: mounted
  19.   u2d07: mounted
  20.   u2d08: mounted
  21.   Standby: u2d09: mounted
复制代码
================================================
  1. t3a:/:<10>sys list
  2. controller         : 2.0
  3. blocksize          : 32k
  4. cache              : auto
  5. mirror             : auto
  6. mp_support         : mpxio
  7. naca               : off
  8. rd_ahead           : off
  9. recon_rate         : med
  10. sys memsize        : 128 MBytes
  11. cache memsize      : 1024 MBytes
  12. enable_volslice    : off
  13. fc_topology        : auto
  14. fc_speed           : 1Gb
  15. disk_scrubber      : on
  16. ondg               : befit
复制代码
环境:2台880主机,Suncluster+vxvm管理,2座T3,各做R5,相互做镜像
主机上面查看T3映射过来2个盘都是OK,且处于vxvm管理下的datadg也都是online
  1. root@s2 # vxdisk list
  2. DEVICE       TYPE      DISK         GROUP        STATUS
  3. c1t0d0s2     sliced    rootdisk_2   rootdg       online
  4. c1t1d0s2     sliced    rootmirror_2  rootdg       online
  5. fabric_0     sliced    fabric_0     datadg       online shared
  6. fabric_1     sliced    fabric_1     datadg       online shared
复制代码
============================================
datadg上面的volume,plex,也都是OK
  1. v  ckbdsj01.dbf -            ENABLED  ACTIVE   10242048 SELECT    -        gen
  2. pl ckbdsj01.dbf-01 ckbdsj01.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  3. sd fabric_0-19  ckbdsj01.dbf-01 fabric_0 188461056 10264576 0     fabric_0 ENA
  4. pl ckbdsj01.dbf-02 ckbdsj01.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  5. sd fabric_1-19  ckbdsj01.dbf-02 fabric_1 188461056 10264576 0     fabric_1 ENA

  6. v  ckbdsj02.dbf -            ENABLED  ACTIVE   10242048 SELECT    -        gen
  7. pl ckbdsj02.dbf-01 ckbdsj02.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  8. sd fabric_0-20  ckbdsj02.dbf-01 fabric_0 198725632 10264576 0     fabric_0 ENA
  9. pl ckbdsj02.dbf-02 ckbdsj02.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  10. sd fabric_1-20  ckbdsj02.dbf-02 fabric_1 198725632 10264576 0     fabric_1 ENA

  11. v  ckbdsj03.dbf -            ENABLED  ACTIVE   10242048 SELECT    -        gen
  12. pl ckbdsj03.dbf-01 ckbdsj03.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  13. sd fabric_0-21  ckbdsj03.dbf-01 fabric_0 208990208 10264576 0     fabric_0 ENA
  14. pl ckbdsj03.dbf-02 ckbdsj03.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  15. sd fabric_1-21  ckbdsj03.dbf-02 fabric_1 208990208 10264576 0     fabric_1 ENA

  16. v  ckbdsj04.dbf -            ENABLED  ACTIVE   10242048 SELECT    -        gen
  17. pl ckbdsj04.dbf-01 ckbdsj04.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  18. sd fabric_0-22  ckbdsj04.dbf-01 fabric_0 219254784 10264576 0     fabric_0 ENA
  19. pl ckbdsj04.dbf-02 ckbdsj04.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  20. sd fabric_1-22  ckbdsj04.dbf-02 fabric_1 219254784 10264576 0     fabric_1 ENA

  21. v  ckrhfl01.dbf -            ENABLED  ACTIVE   10242048 SELECT    -        gen
  22. pl ckrhfl01.dbf-01 ckrhfl01.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  23. sd fabric_0-37  ckrhfl01.dbf-01 fabric_0 536997888 10264576 0     fabric_0 ENA
  24. pl ckrhfl01.dbf-02 ckrhfl01.dbf ENABLED ACTIVE 10264576 CONCAT    -        RW
  25. sd fabric_1-37  ckrhfl01.dbf-02 fabric_1 536997888 10264576 0     fabric_1 ENA
复制代码
能不能直接使用 enable u2d04,将04盘的disable去掉?
还是只能再做更换新盘,等待2次重构,在观察?
作者: doging    时间: 2010-04-02 14:39
Mar 26 13:50:54 ISR1[2]: W: u2d03 SCSI Disk Error Occurred (path = 0x1)

Mar 26 13:50:54 ISR1[2]: W: u2d03 Sense Key = 0x3, Asc = 0x11, Ascq = 0x0

Mar 26 13:50:54 ISR1[2]: W: u2d03 Sense Data Description = Unrecovered Read Error

Mar 26 13:50:54 ISR1[2]: W: u2d03 Valid Information = 0x8896176

Mar 26 13:50:54 ISR1[2]: N: u2d03 SVD_DONE: Command Error = 0x3

Mar 26 13:50:54 ISR1[2]: N: u2d03 sid 2231407 stype 1003 disk error 3


好像u2d03也报了一些错
作者: klaude    时间: 2010-04-02 14:48
恩,故障因该是热备盘没有成功顶上来。
作者: klaude    时间: 2010-04-19 21:59
原本想通过逐步换盘修复R5,尝试后失败,决定利用上下镜像,在线重做其中故障的一个
t3a:/: vol unmount v1
# vxdisk list
  1. DEVICE TYPE DISK GROUP STATUS
  2. c1t0d0s2 sliced rootdisk_2 rootdg online
  3. c1t1d0s2 sliced rootmirror_2 rootdg online
  4. fabric_0 sliced - - online shared
  5. fabric_1 sliced fabric_1 datadg online shared
  6. - - fabric_0 datadg failed was:fabric_0
复制代码
# vxprint -hvt
Every volume has a half plex is ISABLED NODEVICE
# vxdiskadm  -->4(Remove a disk for replacement)
delete the failed disk
# vxdisk list
  1. DEVICE TYPE DISK GROUP STATUS
  2. c1t0d0s2 sliced rootdisk_2 rootdg online
  3. c1t1d0s2 sliced rootmirror_2 rootdg online
  4. fabric_0 sliced - - online shared
  5. fabric_1 sliced fabric_1 datadg online shared
  6. 18
  7. - - fabric_0 datadg removed was:fabric_0
复制代码
t3a:/: vol remove v1
delete T3 volume v1
t3a:/: vol add v1 data u2d01-08 raid 5 standby u2d09
creat the new volume v1 from disk u2d01 to u2d08 and  with u2d09 Hotsapre.
t3a:/: vol init v1 data
initalize the new volume v1 and waite an hours
t3a:/: vol mount v1
# devfsadm –C
# devfsadm
# vxdctl enable
you must to run this command on the both node
# vxdiskadm --> 5(Replace a failed or removed disk)
replace the failed disk
# vxtask list
作者: easybegin    时间: 2010-04-19 22:11
切换, reset u2ctr
作者: klaude    时间: 2010-04-19 23:03
回复 5# easybegin


    为什么要切换?我有点不明白
作者: 沙中有金    时间: 2010-04-20 02:05
别reset 控制器

你先尝试一下手工rebuild到9号盘上去
作者: klaude    时间: 2010-04-20 08:41
回复 7# 沙中有金


    我肯定不会reset 控制器。不需要手动rebuild,T3+会自动rebuild,通过日志查看是否成功即可,我这里是因为03与08都有不可修复的故障,所以只能通过重做。
作者: haishui    时间: 2010-04-20 11:05
备份数据,重做吧,应该是数据的校验有问题了。
作者: klaude    时间: 2010-04-20 12:10
回复 9# haishui


    做之前肯定需要备份数据,而且我已经做完了,直接在线做就可以了,{:3_193:}
作者: westlife521    时间: 2010-04-21 11:15
T3这东东出问题喜欢串联并发出.....
作者: klaude    时间: 2010-04-21 20:46
回复 11# westlife521


    是的兄弟,我确实听到有人遇到这样的情况,所以我每次之前都要去洗洗手!{:3_193:} ,呵呵呵呵呵
作者: michael1983    时间: 2010-04-22 19:17
回复  westlife521


    是的兄弟,我确实听到有人遇到这样的情况,所以我每次之前都要去洗洗手!{:3_ ...
klaude 发表于 2010-04-21 20:46



   
作者: klaude    时间: 2010-04-23 09:45
回复 13# michael1983


    呵呵,难道你不知道这个习惯?呵呵呵呵
作者: michael1983    时间: 2010-04-23 10:37
回复 14# klaude


  确实不知道咱们干IT的还有这一说法
作者: zhmzhouming    时间: 2010-04-23 11:16
  我还以为要去找个童子手来。  六合童子能力挺强的。
作者: klaude    时间: 2010-04-23 17:21
回复 15# michael1983


    现在你知道了哇,呵呵呵呵呵呵
作者: wstar    时间: 2010-04-26 11:14
lz对T3挺熟悉的啊。搞定了吗?
作者: klaude    时间: 2010-04-26 11:39
回复 18# wstar


    早就OK了,你看我主题都写了OK。觉得自己不是很熟悉,每次看书都有新的收获,还是要多看书,多想想,多测试测试,呵呵呵
作者: 要努力学习    时间: 2010-04-26 14:22
数据量大就头疼了。算你幸运。。。。。
作者: klaude    时间: 2010-04-27 22:06
回复 20# 要努力学习


    恩,这倒是,这次还算好,数据不多。
作者: webber121    时间: 2010-04-27 22:18
华为的业务?
作者: klaude    时间: 2010-04-29 10:13
回复 22# webber121


    不是华为,户籍方面的,呵呵呵呵




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2