免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 9399 | 回复: 9
打印 上一主题 下一主题

[HACMP集群] 请教关于Hacmp双机切换的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-04-17 15:04 |只看该作者 |倒序浏览
做hacmp的双机切换测试,用以下方法,从主机切到备的时候成功,当从备机切换回来时候,用同样的方法,切换失败,我现在想确定的是这种切换方法有没有问题

smitty hacmp
-->System Management (C-SPOC)
-->HACMP Resource Group and Application Management
-->Move a Resource Group to Another Node / Site
--> Move Resource Groups to Another Nod

论坛徽章:
0
2 [报告]
发表于 2011-04-17 19:49 |只看该作者
没有问题.
切换失败可能的原因有很多,最好详细说一下你的情况,我们好帮你分析.

论坛徽章:
0
3 [报告]
发表于 2011-04-17 21:15 |只看该作者
要看日志的

论坛徽章:
0
4 [报告]
发表于 2011-04-17 23:02 |只看该作者

RE: 请教关于Hacmp双机切换的问题

谢谢两位的回复,

有两台主机,aix 5.3.0.0 一台数据库oracle 9.2.0.6,另外一台为应用服务器,用IPAT via Replacement模式做hacmp双机互备。
我先在应用主机上做切换操作,过程如下:

smitty hacmp
-->System Management (C-SPOC)
-->HACMP Resource Group and Application Management
-->Move a Resource Group to Another Node / Site
--> Move Resource Groups to Another Node

正常切换,经测试,应用没有可以正常使用,这时候应用主机的service ip被切到数据库主机,用boot ip连上应用主机,做回切操作,其过程如下
smitty hacmp
-->System Management (C-SPOC)
-->HACMP Resource Group and Application Management
-->Move a Resource Group to Another Node / Site
--> Move Resource Groups to Another Node
回切失败,我现在怀疑是不是我在应用主机上做回切操作,引起了回切的失败,但不确定

附件为回切失败时候的日志:
从459行报
Apr 15 01:47:15 EVENT START: event_error 1 TE_RG_MOVE一个错误,然后就接连报一个错误和警告信息

session.zip

11.55 KB, 下载次数: 46

论坛徽章:
0
5 [报告]
发表于 2011-04-17 23:12 |只看该作者
有人回复让俺备受鼓舞,期待着在大家的帮助下,找出问题的原因,让俺确定是不是因为俺的误操作引起的,再次谢谢各位了

论坛徽章:
0
6 [报告]
发表于 2011-04-18 00:07 |只看该作者
共享vg 正常切换,原因可能是共享vg在备机上varyoff的时候,卡主了,导致切换失败
一般的原因都是应用没停下来,或者有活动文件在共享vg 的某个文件系统上
解决了这个问题,应该机一起ok了

论坛徽章:
0
7 [报告]
发表于 2011-04-18 09:07 |只看该作者
谢谢各位的回复

论坛徽章:
0
8 [报告]
发表于 2011-04-18 16:59 |只看该作者
同事给我的解释为当我用这种方式进行切换时,当从主机切换的备机时,主机的cluster服务也就停了,这时候从备机切回来的时候,主机上没有服务来接收这些资源,这时候,整个切换就卡住了。正确方式为从备机切换回主机之前,应该在主机上启动cluster服务,然后进行回切。

正确的切换方式为:

smitty hacmp
-->System Management (C-SPOC)
-->Manage HACMP Services
-->Stop Cluster Services
-->Select an Action on Resource Groups
-->f4
-->Move Resource Groups

论坛徽章:
0
9 [报告]
发表于 2011-04-18 17:03 |只看该作者
最后问题还是解决了,先是重启cluster的服务,关闭失败,就重启主机,重启主机后,hacmp启支成功,但数据库启动失败,数据库alert log报
Errors in file /oracle/admin/smsg/bdump/smsg_ckpt_491690.trc:
ORA-00202: controlfile: '/dev/rlvcon1'
ORA-27091: skgfqio: unable to queue I/O
ORA-27072: skgfdisp: I/O error
IBM AIX RISC System/6000 Error: 5: I/O error
Additional information: 721
Fri Apr 15 04:04:41 2011

刚开始以为是bug,后来看了errpt,确定为盘阵有问题,做了盘阵的恢复后,启动成功,整个服务恢复。

论坛徽章:
0
10 [报告]
发表于 2011-06-03 16:51 |只看该作者
我遇到过ha切换不成功的原因是阵列锁盘,导致无法切换!后来实在没法只好吧卷组属性改了!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP