免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4428 | 回复: 13
打印 上一主题 下一主题

有人能看的出这个VXVM的宕机原因吗 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-06-08 10:17 |只看该作者 |倒序浏览
WARNING: /scsi_vhci/ssd@g600a0b8000336310000002d948e4398b (ssd13):
        i/o to invalid geometry

WARNING: /scsi_vhci/ssd@g600a0b8000336310000002d948e4398b (ssd13):
        i/o to invalid geometry

WARNING: /scsi_vhci/ssd@g600a0b8000336310000002d948e4398b (ssd13):
        i/o to invalid geometry

WARNING: /scsi_vhci/ssd@g600a0b8000336310000002d948e4398b (ssd13):
        i/o to invalid geometry

WARNING: /scsi_vhci/ssd@g600a0b8000336310000002d948e4398b (ssd13):
        i/o to invalid geometry

WARNING: /scsi_vhci/ssd@g600a0b8000336310000002d948e4398b (ssd13):
        i/o to invalid geometry

WARNING: /scsi_vhci/ssd@g600a0b8000336310000002d948e4398b (ssd13):
        i/o to invalid geometry

WARNING: VxVM vxio V-5-0-196 Kernel log update failed: Volume radius_vol detache
d
WARNING: VxVM vxio V-5-0-3 Volume radius_vol block 16:
        Uncorrectable write error on Subdisk SUN6140_0_4-01 block 16
WARNING: msgcnt 1 mesg 039: V-2-39: vx_writesuper - /dev/vx/dsk/radiusdg/radius_
vol file system super-block write error
WARNING: msgcnt 2 mesg 031: V-2-31: vx_disable - /dev/vx/dsk/radiusdg/radius_vol
file system disabled


panic[cpu24]/thread=30005799260:
forced crash dump initiated at user request


000002a102cad960 genunix:kadmin+4a4 (b4, 0, 0, 1225400, 5, 0)
  %l0-3: 000000000182b400 00000000011ddc00 0000000000000004 0000000000000004
  %l4-7: 0000000000000438 0000000000000010 0000000000000004 0000000000000000
000002a102cada20 genunix:uadmin+11c (60037c83e60, 0, 0, ff390000, 0, 0)
  %l0-3: 0000000000000000 0000000000000000 00000000488c0000 000000000000488c
  %l4-7: 0000000000000001 0000000000000000 0000000000000005 0000030005799260

syncing file systems...
12
8
done
dumping to /dev/md/dsk/d20, offset 3357409280, content: kernel

业务切到B机去了 B机上面vxvm的状态是完全正常的
主机messages里面没有任何报错信息 只有正常启动的信息 机器是忽然自己reset的
这个是crash  msgbuf.0的信息
存储确认过了 没有任何问题 硬件都是正常的
这个感觉非常奇怪啊 是不是什么BUG啊 有高人能看出来吗

论坛徽章:
0
2 [报告]
发表于 2010-06-08 10:23 |只看该作者
我发现SUN 现在有很多hang机 是没有任何报错信息的 就是设置了deadman 也经常没有crash信息

论坛徽章:
0
3 [报告]
发表于 2010-06-08 10:33 |只看该作者
去看看coredump吧 没信息的话只能看那个了

论坛徽章:
2
双鱼座
日期:2014-02-23 12:10:03操作系统版块每日发帖之星
日期:2015-12-17 06:20:00
4 [报告]
发表于 2010-06-08 10:55 |只看该作者
1.检查该主机ssd13磁盘对应的链路;
2.检查ssd13对应的VM磁盘;
3.检查/dev/vx/dsk/radiusdg/radius_vol的文件系统;
4.检查系统补丁及VxVM补丁是否需要更新。

最后,给LZ个建议,提问的时候把自己的软硬件环境描述下,出问题前做过什么操作之类的!

论坛徽章:
0
5 [报告]
发表于 2010-06-08 10:57 |只看该作者
panic[cpu24]/thread=30005799260:
forced crash dump initiated at user request


000002a102cad960 genunix:kadmin+4a4 (b4, 0, 0, 1225400, 5, 0)


是不是安装了vcs呀,这个panic是由第三方软件发起的,


看前边有些io 报错,可能是io报错引起vxvm dg不可访问,应用检测到卷不可访问而触发panic

论坛徽章:
0
6 [报告]
发表于 2010-06-08 11:29 |只看该作者
估计是盘的backup信息出问题了,不能正常识别硬盘,导致panic了

论坛徽章:
0
7 [报告]
发表于 2010-06-08 11:32 |只看该作者
我也是怀疑这个第3方软件 但是是VXVM这个层面还是应用这个层面了 就搞不清楚

论坛徽章:
0
8 [报告]
发表于 2010-06-08 11:36 |只看该作者
蜘蛛 这个radius_dg切到B机后 状态完全正常

dg radiusdg     default      default  20000    1261807700.102.shAAA01

dm SUN6140_0_10 SUN6140_0_8  auto     65536    1572732672 -
dm SUN6140_1_2  SUN6140_1_2  auto     65536    1572732672 -

v  radius_vol   -            ENABLED  ACTIVE   1572730880 SELECT  -        fsgen
pl radius_vol-01 radius_vol  ENABLED  ACTIVE   1572730880 CONCAT  -        RW
sd SUN6140_0_10-01 radius_vol-01 SUN6140_0_10 0 1572730880 0      SUN6140_0_8 ENA
pl radius_vol-02 radius_vol  ENABLED  ACTIVE   1572730880 CONCAT  -        RW
sd SUN6140_1_2-01 radius_vol-02 SUN6140_1_2 0  1572730880 0       SUN6140_1_2 ENA


还有最新的EIS好象没有给vxvm 5.0 for mp1的什么补丁 我在里面只找到了for mp3的补丁 这个VERITAS的版本是5.0 for mp1的

所有的连路都是正常的 不然不会切过去后 B机器运行了很长一段时间了 都没有报错

主机构架是2台 T5220和2台6140做的双机 存储之间用VXVM做了mirror
双机软件是VCS的 版本是5.0 for MP1

论坛徽章:
0
9 [报告]
发表于 2010-06-08 11:37 |只看该作者
估计是盘的backup信息出问题了,不能正常识别硬盘,导致panic了
easybegin 发表于 2010-06-08 11:29



   这个有办法解决吗 这个VXVM的文件系统是vxfs veritas自己的文件系统

论坛徽章:
0
10 [报告]
发表于 2010-06-08 11:44 |只看该作者
WARNING: msgcnt 1 mesg 039: V-2-39: vx_writesuper - /dev/vx/dsk/radiusdg/radius_
vol file system super-block write error
WARNING: msgcnt 2 mesg 031: V-2-31: vx_disable - /dev/vx/dsk/radiusdg/radius_vol
file system disabled

我是感觉应用把VXVM跑崩的了 感觉是因为文件系统那里某些值不够 达到了极限 所以就切过去的了 而且宕机的时候正是业务最高峰的时候
有没有人有类似的经验
其实我在考虑2个6140的LUN做mirror 哪怕就是某一个6140的连路完全坏的了 因为不应该影响业务 不然mirror就没意义了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP