免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3690 | 回复: 3
打印 上一主题 下一主题

rhcs中failoverdomain的restart、relocate疑问 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-07-19 13:16 |只看该作者 |倒序浏览
5可用积分
rhcs 4.6
rhcs 5.0

都遇到这个问题

选restart的话,把当前运行资源的服务器的网线拔掉,资源会不断的重启,但不会切换到另外一台,只好选择relocate

但我看关于restart的说明:按我的理解是,首先尝试重启,然后重启不行就relocate

据说是由于dell 6850没有专门的fence设备导致,如果是manual-fence都会这样,是真的嘛》?


各位请教!

[ 本帖最后由 yuhuohu 于 2008-7-19 13:17 编辑 ]

最佳答案

查看完整内容

只要服务能成功,能够正常切换,这个cluster基本上就是成功的。假设双节点集群中的某个节点异常,这个异常指的是心跳丢失,那么就会发起fence动作,但是因为没有fence设备,在这个时候只要在任何一台机器上手动执行fence_manual加对方的IP,那么原本运行在对方机器上的服务就会fail over过来。这样就视同一次fence动作发生。因为fence_manual是假的fence,所以不管任何时候执行都是成功的,所以只要执行fence_manual,服务就会fail ...

论坛徽章:
0
2 [报告]
发表于 2008-07-19 13:16 |只看该作者
只要服务能成功,能够正常切换,这个cluster基本上就是成功的。

假设双节点集群中的某个节点异常,这个异常指的是心跳丢失,那么就会发起fence动作,但是因为没有fence设备,在这个时候只要在任何一台机器上手动执行fence_manual加对方的IP,那么原本运行在对方机器上的服务就会fail over过来。这样就视同一次fence动作发生。
因为fence_manual是假的fence,所以不管任何时候执行都是成功的,所以只要执行fence_manual,服务就会failover。
但我也提到了,只有心跳丢失才会引发fence,其他情况都不会。所以假设现在服务只是在其中一台机器上启动多次不成功,但心跳不丢失的话,最多也是启动N次停在那里或者继续不停启动。

至于准确的情况,我当时记得是三次,但是我自己的试验好像并没有涉及到这方面。
建议你先不要上自己的脚本或者服务,而是加一个简单的HTTP服务测试一下应该就清楚了。

论坛徽章:
0
3 [报告]
发表于 2008-07-19 17:08 |只看该作者
首先你理解的没错,如果是relocate的话,服务会立刻切换到其他的机器上。如果是restart的话,应该是重启三次不行就relocate。

只有心跳断了才会发生fence,只有fence成功才能relocate成功。

论坛徽章:
0
4 [报告]
发表于 2008-07-19 18:05 |只看该作者
原帖由 jerrywjl 于 2008-7-19 17:08 发表
首先你理解的没错,如果是relocate的话,服务会立刻切换到其他的机器上。如果是restart的话,应该是重启三次不行就relocate。

只有心跳断了才会发生fence,只有fence成功才能relocate成功。



谢谢你的回复,我注意观察了日志,restart了n次资源,远不止3次,就是不肯relocate。。

是不是因为我指定的fence_device是manual_fence的关系
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP