免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5975 | 回复: 8
打印 上一主题 下一主题

heartbeat 2.1.3中auto_failback不管用? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-12-20 23:09 |只看该作者 |倒序浏览
我在两端的ha.cf文件中,都设置成了auto_failback off,但当主的启动后,还是会抢占回资源,不知怎么回事?是不是一定要用crm 方式才可以呀,如果是的话,应该怎么设置呢?

论坛徽章:
0
2 [报告]
发表于 2009-12-21 11:00 |只看该作者
顶,没有人知道吗?

论坛徽章:
0
3 [报告]
发表于 2009-12-21 13:20 |只看该作者
怎么感觉是配置没有生效阿?
重启以后你确定配置正确吗?

论坛徽章:
0
4 [报告]
发表于 2009-12-21 16:47 |只看该作者
我的ha.cf配置这样写的:

autojoin none
debugfile /var/log/ha-debug
logfile /var/log/ha-log

warntime 5
deadtime 15
initdead 60
keepalive 2

udpport 694
ucast eth0 192.168.2.100
ping 192.168.2.1

auto_failback off

node Node-a
node Node-b

respawn hacluster /usr/lib/heartbeat/ipfail
respawn hacluster /usr/lib/heartbeat/dopd
use_logd yes

开heartbeat服务也没有提示错误。

[ 本帖最后由 coldcoffee 于 2009-12-21 16:51 编辑 ]

论坛徽章:
0
5 [报告]
发表于 2009-12-22 16:28 |只看该作者
heartbeat 这里的确是有bug,  我也碰到过,
只有hack 其配置了。

其实很麻烦, 弄得不好, 即使生效了, 还会影响 拔网线切换的功能。

我的配置步骤如下:
(基本上是工作的。  当resource 很多时, 有时会发现  auto failback off  时依然 auto failback;
heartbeat 使用了一个所谓的积分策略来控制切换, 老实说, 用了快两年了, 感觉这个地方heartbeat 做的不好,
太复杂, 导致不好控制。)

1)
当auto_failback on 时:
“default-resource-stickiness" value="0"
当auto_failback off 时:
“default-resource-stickiness" value="100"

2)
default-resource-failure-stickiness设置为-100
“default-resource-failure-stickiness" value="-100"

3)
按照帖子的提示,加入了pingd的rule.
将prefered_location调整为100.

去掉了下面这种改动:
         <rule id="rsc_location_group_1:rule" score_attribute="pingd">
           <expression id="rsc_location_group_1:expr:defined" attribute="pingd" operation="defined"/>
         </rule>

最后的结果如下:

<rsc_location id="rsc_location_group_1" rsc="group_1">
  <rule id="prefered_location_group_1" score="100">
    <expression attribute="#uname" id="prefered_location_group_1_expr" operation="eq" value="linux-10"/>
  </rule>
  <rule id="rsc_location_group_1:connected:rule" score="-INFINITY" boolean_op="or">
    <expression id="rsc_location_group_1:connected:expr:undefined"
      attribute="pingd" operation="not_defined"/>
    <expression id="rsc_location_group_1:connected:expr:zero"
      attribute="pingd" operation="lte" value="0"/>
  </rule>
</rsc_location>

[ 本帖最后由 leeedward 于 2009-12-22 16:37 编辑 ]

论坛徽章:
0
6 [报告]
发表于 2009-12-22 16:30 |只看该作者
下面的帖子对我帮助很大:  转一下

http://linux.chinaunix.net/bbs/archiver/tid-1046169.html

2009-3-2 19:37 skczcm
由于redhat rhcs 配置要求较高,heartbeat 是个不错的选择,heartbeat R1-style 我认为在实际中用处不大,官方主要支持的切换
1.启动(包含拔电源)
2.停止heartbeat服务(主停)
3.拔网线(这点许多用户在实际测试做不到,用ipfail)
我前一段时间刚好实施一个项目,使用R2-style
1.建议首先使用r1配置好相应的资源,再改换到R2-style
2.我认为主要r2打开crm,这样能监控单个资源
3.拔网线必须使用pingd(R2-style)删除ipfail增加
respawn root /usr/lib/heartbeat/pingd -m 100 -d 5s -a pingd
4.转换haresources 到cib.xml
rm -rf /var/lib/heartbeat/crm/cib.xml*
/usr/lib/heartbeat/haresources2cib.py --stout -c ha.cf haresources
这样就得到了cib.xml
5.修改全局变量(cib.xml)
default_resource_stickiness=100,default_fail_resource_stickines=-100
为了拔网线马上切换必须增加下列
<rsc_location id="my_resource:connected" rsc="my_resource">
  <rule id="my_resource:connected:rule" score="-INFINITY" boolean_op="or">
    <expression id="my_resource:connected:expr:undefined"
      attribute="pingd" operation="not_defined"/>
    <expression id="my_resource:connected:expr:zero"
      attribute="pingd" operation="lte" value="0"/>
  </rule>
</rsc_location>
注:rsc="my_resource"改成含vip资源的group或IP资源

6.auto_failback 在r2-style 对应的是cib.xml里的default_resource_stickiness
定义为0等于auto_failback on这是必须注意的
7.相应的资源服务停止的切换主要通过ocf或lsb的风格监控,能否切换及次数主要是根据score来计算的
一般上述参数停止服务时heartbeat会重启2-3次服务,如起不来服务再切换到备机
总的来说,一项资源(或者资源组)在一个节点运行迁移到另一个节点之前,可以失败的次数的计算公式可以如下表示:

(nodeA score - nodeB score + stickiness)/abs(failure stickiness),即为A节点分数减去B节点分数,再加上资源运行分数后得到的总分数,除以资源失败分数的绝对值。节点的得分:
node+resource+failcount*failure具体可以参考linux-ha-org网站score的阐述

论坛徽章:
0
7 [报告]
发表于 2009-12-22 16:33 |只看该作者
谢谢了,我先看看去。

论坛徽章:
0
8 [报告]
发表于 2009-12-22 23:14 |只看该作者

回复 #1 coldcoffee 的帖子

积分策略 问题 08年12月份有对应的帖子

论坛徽章:
0
9 [报告]
发表于 2009-12-23 17:16 |只看该作者
原帖由 kns1024wh 于 2009-12-22 23:14 发表
积分策略 问题 08年12月份有对应的帖子

麻烦给个链吧,没有搜到,谢谢了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP