论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2011-04-17 15:04 |只看该作者 |倒序浏览

做hacmp的双机切换测试，用以下方法，从主机切到备的时候成功，当从备机切换回来时候，用同样的方法，切换失败，我现在想确定的是这种切换方法有没有问题

smitty hacmp
-->System Management (C-SPOC)
-->HACMP Resource Group and Application Management
-->Move a Resource Group to Another Node / Site
--> Move Resource Groups to Another Nod

HACMP, HACMP

文库|博客

x0799

白手起家

论坛徽章:: 0

2楼 [报告]

发表于 2011-04-17 19:49 |只看该作者

没有问题.
切换失败可能的原因有很多,最好详细说一下你的情况,我们好帮你分析.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hello_unix

版主

论坛徽章:: 0

3楼 [报告]

发表于 2011-04-17 21:15 |只看该作者

要看日志的

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

leixaz

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2011-04-17 23:02 |只看该作者

RE: 请教关于Hacmp双机切换的问题

谢谢两位的回复，

有两台主机，aix 5.3.0.0 一台数据库oracle 9.2.0.6，另外一台为应用服务器，用IPAT via Replacement模式做hacmp双机互备。
我先在应用主机上做切换操作，过程如下：

smitty hacmp
-->System Management (C-SPOC)
-->HACMP Resource Group and Application Management
-->Move a Resource Group to Another Node / Site
--> Move Resource Groups to Another Node

正常切换，经测试，应用没有可以正常使用，这时候应用主机的service ip被切到数据库主机，用boot ip连上应用主机，做回切操作，其过程如下
smitty hacmp
-->System Management (C-SPOC)
-->HACMP Resource Group and Application Management
-->Move a Resource Group to Another Node / Site
--> Move Resource Groups to Another Node
回切失败，我现在怀疑是不是我在应用主机上做回切操作，引起了回切的失败，但不确定

附件为回切失败时候的日志：
从459行报
Apr 15 01:47:15 EVENT START: event_error 1 TE_RG_MOVE一个错误，然后就接连报一个错误和警告信息

session.zip

11.55 KB, 下载次数: 46

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

leixaz

白手起家

论坛徽章:: 0

5楼 [报告]

发表于 2011-04-17 23:12 |只看该作者

有人回复让俺备受鼓舞，期待着在大家的帮助下，找出问题的原因，让俺确定是不是因为俺的误操作引起的，再次谢谢各位了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hello_unix

版主

论坛徽章:: 0

6楼 [报告]

发表于 2011-04-18 00:07 |只看该作者

共享vg 正常切换，原因可能是共享vg在备机上varyoff的时候，卡主了，导致切换失败
一般的原因都是应用没停下来，或者有活动文件在共享vg 的某个文件系统上
解决了这个问题，应该机一起ok了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

leixaz

白手起家

论坛徽章:: 0

7楼 [报告]

发表于 2011-04-18 09:07 |只看该作者

谢谢各位的回复

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

leixaz

白手起家

论坛徽章:: 0

8楼 [报告]

发表于 2011-04-18 16:59 |只看该作者

同事给我的解释为当我用这种方式进行切换时，当从主机切换的备机时，主机的cluster服务也就停了，这时候从备机切回来的时候，主机上没有服务来接收这些资源，这时候，整个切换就卡住了。正确方式为从备机切换回主机之前，应该在主机上启动cluster服务，然后进行回切。

正确的切换方式为：

smitty hacmp
-->System Management (C-SPOC)
-->Manage HACMP Services
-->Stop Cluster Services
-->Select an Action on Resource Groups
-->f4
-->Move Resource Groups

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

leixaz

白手起家

论坛徽章:: 0

9楼 [报告]

发表于 2011-04-18 17:03 |只看该作者

最后问题还是解决了，先是重启cluster的服务，关闭失败，就重启主机，重启主机后，hacmp启支成功，但数据库启动失败，数据库alert log报
Errors in file /oracle/admin/smsg/bdump/smsg_ckpt_491690.trc:
ORA-00202: controlfile: '/dev/rlvcon1'
ORA-27091: skgfqio: unable to queue I/O
ORA-27072: skgfdisp: I/O error
IBM AIX RISC System/6000 Error: 5: I/O error
Additional information: 721
Fri Apr 15 04:04:41 2011

刚开始以为是bug，后来看了errpt，确定为盘阵有问题，做了盘阵的恢复后，启动成功，整个服务恢复。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wmj2011

白手起家

论坛徽章:: 0

10楼 [报告]

发表于 2011-06-03 16:51 |只看该作者

我遇到过ha切换不成功的原因是阵列锁盘，导致无法切换！后来实在没法只好吧卷组属性改了！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 操作系统 › AIX › 请教关于Hacmp双机切换的问题

[HACMP集群] 请教关于Hacmp双机切换的问题 [复制链接]

RE: 请教关于Hacmp双机切换的问题