免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3557 | 回复: 1
打印 上一主题 下一主题

VxVM发生serial split brain 的故障排除 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-09-10 07:54 |只看该作者 |倒序浏览

                登录系统提示有邮件,发现有hot relocation了,原来mmsdg06 磁盘失败了.
root@mmsc1 # vxdisk list
DEVICE       TYPE            DISK         GROUP        STATUS
c1t0d0s2     auto:none       -            -            online invalid
c1t2d0s2     auto:none       -            -            online invalid
c1t3d0s2     auto:sliced     -            -            online invalid
c3t8d0s2     auto:sliced     oradg01      oradg        online
c3t9d0s2     auto:sliced     mmsdg01      mmsdg        online
c3t10d0s2    auto:sliced     mmsdg02      mmsdg        online
c3t11d0s2    auto:sliced     mmsdg03      mmsdg        online
c3t12d0s2    auto:sliced     oradg03      oradg        online spare
c5t8d0s2     auto:sliced     oradg02      oradg        online
c5t9d0s2     auto:sliced     mmsdg04      mmsdg        online
c5t10d0s2    auto:sliced     mmsdg05      mmsdg        online
c5t11d0s2    auto:sliced     -            -            online
c5t12d0s2    auto:sliced     mmsdg07      mmsdg        online spare
-            -         mmsdg06      mmsdg        failed was:c5t11d0s2
尝试恢复磁盘
root@mmsc1 # vxreattach
root@mmsc1 # vxdisk list
DEVICE       TYPE            DISK         GROUP        STATUS
c1t0d0s2     auto:none       -            -            online invalid
c1t2d0s2     auto:none       -            -            online invalid
c1t3d0s2     auto:sliced     -            -            online invalid
c3t8d0s2     auto:sliced     oradg01      oradg        online
c3t9d0s2     auto:sliced     mmsdg01      mmsdg        online
c3t10d0s2    auto:sliced     mmsdg02      mmsdg        online
c3t11d0s2    auto:sliced     mmsdg03      mmsdg        online
c3t12d0s2    auto:sliced     oradg03      oradg        online spare
c5t8d0s2     auto:sliced     oradg02      oradg        online
c5t9d0s2     auto:sliced     mmsdg04      mmsdg        online
c5t10d0s2    auto:sliced     mmsdg05      mmsdg        online
c5t11d0s2    auto:sliced     mmsdg06      mmsdg        online
c5t12d0s2    auto:sliced     mmsdg07      mmsdg        online spare
reattach之后,磁盘又可以被vxvm管理了, 说明磁盘并没有物理错误。但是我还是想让mmdg07为热备盘,由于有部分数据(plex)在mmsdg07上,接下来要把mmsdg07替换成mmsdg06,就是说要把在mmsdg07数据倒换到mmsdg06上,把mmsdg07强制删除
root@mmsc1 # vxdg -g mmsdg  -k rmdisk mmsdg07
root@mmsc1 # vxdisk list
DEVICE       TYPE            DISK         GROUP        STATUS
c1t0d0s2     auto:none       -            -            online invalid
c1t2d0s2     auto:none       -            -            online invalid
c1t3d0s2     auto:sliced     -            -            online invalid
c3t8d0s2     auto:sliced     oradg01      oradg        online
c3t9d0s2     auto:sliced     mmsdg01      mmsdg        online
c3t10d0s2    auto:sliced     mmsdg02      mmsdg        online
c3t11d0s2    auto:sliced     mmsdg03      mmsdg        online
c3t12d0s2    auto:sliced     oradg03      oradg        online spare
c5t8d0s2     auto:sliced     oradg02      oradg        online
c5t9d0s2     auto:sliced     mmsdg04      mmsdg        online
c5t10d0s2    auto:sliced     mmsdg05      mmsdg        online
c5t11d0s2    auto:sliced     mmsdg06      mmsdg        online
c5t12d0s2    auto:sliced     -            -            online
-            -         mmsdg07      mmsdg        removed was:c5t12d0s2
mmsdg06替换到mmsdg07
root@mmsc1 # vxdg -g mmsdg repldisk mmsdg07=mmsdg06
root@mmsc1 # vxdisk list
DEVICE       TYPE            DISK         GROUP        STATUS
c1t0d0s2     auto:none       -            -            online invalid
c1t2d0s2     auto:none       -            -            online invalid
c1t3d0s2     auto:sliced     -            -            online invalid
c3t8d0s2     auto:sliced     oradg01      oradg        online
c3t9d0s2     auto:sliced     mmsdg01      mmsdg        online
c3t10d0s2    auto:sliced     mmsdg02      mmsdg        online
c3t11d0s2    auto:sliced     mmsdg03      mmsdg        online
c3t12d0s2    auto:sliced     oradg03      oradg        online spare
c5t8d0s2     auto:sliced     oradg02      oradg        online
c5t9d0s2     auto:sliced     mmsdg04      mmsdg        online
c5t10d0s2    auto:sliced     mmsdg05      mmsdg        online
c5t11d0s2    auto:sliced     mmsdg07      mmsdg        online
c5t12d0s2    auto:sliced     -            -            online
恢复正常名字
root@mmsc1 # vxedit -g mmsdg rename mmsdg07=mmsdg06
查询磁盘状态
root@mmsc1 # vxdisk list
DEVICE       TYPE            DISK         GROUP        STATUS
c1t0d0s2     auto:none       -            -            online invalid
c1t2d0s2     auto:none       -            -            online invalid
c1t3d0s2     auto:sliced     -            -            online invalid
c3t8d0s2     auto:sliced     oradg01      oradg        online
c3t9d0s2     auto:sliced     mmsdg01      mmsdg        online
c3t10d0s2    auto:sliced     mmsdg02      mmsdg        online
c3t11d0s2    auto:sliced     mmsdg03      mmsdg        online
c3t12d0s2    auto:sliced     oradg03      oradg        online spare
c5t8d0s2     auto:sliced     oradg02      oradg        online
c5t9d0s2     auto:sliced     mmsdg04      mmsdg        online
c5t10d0s2    auto:sliced     mmsdg05      mmsdg        online
c5t11d0s2    auto:sliced     mmsdg06      mmsdg        online
c5t12d0s2    auto:sliced     -            -            online
尝试把c5t12d0s2加回到mmsdg, 但是报错了
root@mmsc1 # vxdg -g mmsdg adddisk mmsdg07=c5t12d0s2
VxVM vxdg ERROR V-5-1-10127 associating disk-media mmsdg07 with c5t12d0s2:
        Serial Split Brain detected. Run vxsplitlines
发生了ssb,怎么办?? ssb产生的原因一般都是系统配置不一致引起的,按提示使用vxsplitlines命令
root@mmsc1 # vxsplitlines -g  mmsdg
[ ######### ]
  VxVM vxsplitlines NOTICE V-5-2-2708 There are 1 pools.The Following are the disks in each pool. Each disk in the same poolhas config copies that are similar.  VxVM vxsplitlines INFO V-5-2-2707 Pool 0.c3t9d0s2 mmsdg01To see the configuration copy from this disk issue/etc/vx/diag.d/vxprivutil dumpconfig /dev/vx/dmp/c3t9d0s3To import the diskgroup with config copy from thisdisk use the following command/usr/sbin/vxdg -o selectcp=1211690416.23.mmsc1 import mmsdgThe following are the disks whose ssb ids don't match in this configcopymmsdg06
如果要执行上面的import话只能停止业务,没办法,先把双机停掉
root@mmsc1 # scswitch -F -g mms_rg
umount所有卷 ....
(此处省略一些操作)
把mmsdg逐出
root@mmsc1 # vxdg deport mmsdg
再使用上面的提示命令导入dg
/usr/sbin/vxdg -o selectcp=1211690416.23.mmsc1 import mmsdg
恢复成功!先把业务起来要紧
online所有卷,由于原来的mmdg07磁盘被更换过,这里启动卷过程系统会自动做镜像同步
root@mmsc1 # vxvol -g mmsdg start all  
手工mount卷
mount ...(此处省略一些mount操作)
尝试拉起业务, 结果正常
root@mmsc1 # scswitch -z -g mms_rg -h mmsc1
接下来把c5t12d0s2重新加入到mmsdg
root@mmsc1 # vxdg -g mmsdg adddisk mmsdg07=c5t12d0   这步没有提示错误,OK!
root@mmsc1 # vxedit -g mmsdg set spare=on mmsdg07
完成了整个操作过程。
               
               
               
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u1/43930/showart_1180648.html

论坛徽章:
0
2 [报告]
发表于 2008-12-03 09:55 |只看该作者

回复 #1 小鹭 的帖子

好东西

这才是好的共享!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP