免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 14270 | 回复: 6
打印 上一主题 下一主题

heartbeat2.x的测试终结篇,针对使用heartbeat的新手 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-12-09 17:58 |只看该作者 |倒序浏览
下面的内容针对heartbeat新手,很多的操作是putty上的直接复制
Heartbeat 2.x 功能
2.x和1.x最主要的区别在于,
1) 2.x支持CRM管理,资源文件由原来的haresources变为cib.xml,
2) 支持OCF格式的resource agent,
3) 可以对多资源组进行独立监控
4)支持多节点

一、下载软件包
下载libnet
http://www.packetfactory.net/libnet/
下载heartbeat
http://www.linux-ha.org/DownloadSoftware
http://hg.linux-ha.org/lha-2.1/archive/STABLE-2.1.4.tar.bz2
二、编译安装软件包
tar -xvf libnet-1.1.3-RC-01.tar.gz(此版本有问题,使用1.2版本)
cd libnet
./configure ; make ; make install
cd ..
tar -xvf Heartbeat-STABLE-2-1-STABLE-2.1.4.tar.bz2
cd Heartbeat-STABLE-2-1-STABLE-2.1.4
./ConfigureMe configure ; make ; make install

在包含自 /usr/include/libnet.h:120 的文件中,
                 从send_arp.c:33:
/usr/include/./libnet/libnet-types.h:36:23: 错误:../config.h:没有那个文件或者目录
gmake[2]: *** [send_arp.o] 错误 1
gmake[2]: Leaving directory `/w/Heartbeat-STABLE-2-1-STABLE-2.1.4/heartbeat/libnet_util'
gmake[1]: *** [install-recursive] 错误 1
gmake[1]: Leaving directory `/w/Heartbeat-STABLE-2-1-STABLE-2.1.4/heartbeat'
make: *** [install-recursive] 错误 1
更换libnet1.2的稳定版本
tar -xvf libnet.tar.gz

执行相同的编译没有错误
三、编辑配置文件
groupadd -g 694 haclient
useradd -u 694 -g haclient hacluster

这个操作是编译安装必须的过程
/usr/share/doc/heartbeat-2.1.4此目录中放置的是配置文件的示例
  1. httpd is an unknown Resource Agent. Please refer to http://www.linux-ha.org/ResourceAgent
  2. 说明没有httpd服务,安装上就可以了
  3. rpm -ivh httpd-2.2.3-11.el5_1.3.x86_64.rpm
  4. rs2 heartbeat: [9834]: EMERG: Rebooting system.  Reason: /usr/lib64/heartbeat/cib
复制代码
如果没有上述账户将会出现上面的错误

  1. rm -rf /var/run/heartbeat

  2. 修改heartbeat目录权限,可以用以下命令:
  3. find / -type d -name "heartbeat" -exec chown -R hacluster {} \;
  4. find / -type d -name "heartbeat" -exec chgrp -R haclient {} \;
  5. chown -R hacluster /usr/lib/heartbeat
  6. chown -R hacluster /usr/lib/ocf/resource.d/heartbeat
  7. chown -R hacluster /usr/include/heartbeat
  8. chown -R hacluster /usr/share/heartbeat
  9. chown -R hacluster /var/lib/heartbeat
  10. chown -R hacluster /var/run/heartbeat
  11. chgrp -R haclient /usr/lib/heartbeat
  12. chgrp -R haclient /usr/lib/ocf/resource.d/heartbeat
  13. chgrp -R haclient /usr/include/heartbeat
  14. chgrp -R haclient /usr/share/heartbeat
  15. chgrp -R haclient /var/lib/heartbeat
  16. chgrp -R haclient /var/run/heartbeat
复制代码
建立账户就是解决这个问题的。
  1. # cat authkeys
  2. auth 1
  3. 1 crc
  4. #chmod 600 authkeys
复制代码
这个步骤是不能缺少的

  1. cat ha.cf
  2. debugfile /var/log/ha-debug
  3. logfile /var/log/ha-log
  4. logfacility     local0
  5. keepalive 2
  6. deadtime 10
  7. warntime 5
  8. initdead 60
  9. udpport 694
  10. #baud    19200
  11. #serial  /dev/ttyS0      # Linux
  12. #bcast   eth1
  13. mcast eth0 225.0.0.1 694 1 0
  14. #ucast eth1 172.16.1.134
  15. auto_failback on
  16. watchdog /dev/watchdog
  17. crm yes
  18. node    rs11
  19. node    rs12
  20. ping 192.168.1.141
  21. ping_group group1 10.10.10.254 10.10.10.253
  22. respawn hacluster /usr/lib/heartbeat/ipfail
  23. #respawn hacluster /usr/lib/heartbeat/pingd
  24. #apiauth ping gid=haclient uid=hacluster
  25. apiauth ipfail gid=haclient uid=hacluster
  26. respawn hacluster /usr/lib/heartbeat/cibmon -d
  27. apiauth cibmon   uid=hacluster
复制代码
  1. #cat bak.haresources
  2. rs11   192.168.1.145  httpd
  3. 这个文件原名为haresources在1.x上使用,不过为了区别使用此名称
  4. 如不使用此配置方式将出现资源无法启动的问题;类似 rs11 192.168.1.145/24/eth0 httpd
  5. 生成
复制代码
附上一段配置文件cib.xml的生成方式/lib64标识x86_64的方式

  1. rm -rf /var/lib/heartbeat/crm/cib.xml*
  2. /usr/lib64/heartbeat/haresources2cib.py haresources
  3. rm -rf /var/lib/heartbeat/crm/cib.xml*
  4. /usr/lib64/heartbeat/haresources2cib.py -stout -c /etc/ha.d/ha.cf /etc/ha.d/haresources
  5. rm -rf /var/lib/heartbeat/crm/cib.xml*
  6. /usr/lib64/heartbeat/haresources2cib.py -stout -c /etc/ha.d/ha.cf /etc/ha.d/bak.haresources


  7.   rm -rf /var/lib/heartbeat/crm/cib.xml*
  8. /usr/lib/heartbeat/haresources2cib.py -stout -c /etc/ha.d/ha.cf /etc/ha.d/bak.haresources
  9. scp /var/lib/heartbeat/crm/cib.xml 192.168.1.147:/var/lib/heartbeat/crm/cib.xml

  10.   scp ha.cf root@192.168.1.144:/etc/ha.d/ha.cf
  11. scp /var/lib/heartbeat/crm/cib.xml root@192.168.1.144:/var/lib/heartbeat/crm/cib.xml
复制代码

  1. cat /var/lib/heartbeat/crm/cib.xml
  2.                 <resources>
  3.                         <group id="group_1">
  4.                                 <primitive class="ocf" id="IPaddr_192_168_1_145" provider="heartbeat" type="IPaddr">
  5.                                         <operations>
  6.                                                 <op id="IPaddr_192_168_1_145_mon" interval="5s" name="monitor" timeout="5s"/>
  7.                                         </operations>
  8.                                         <instance_attributes id="IPaddr_192_168_1_145_inst_attr">
  9.                                                 <attributes>
  10.                                                         <nvpair id="IPaddr_192_168_1_145_attr_0" name="ip" value="192.168.1.145"/>
  11.                                                 </attributes>
  12.                                         </instance_attributes>
  13.                                 </primitive>
  14.                                 <primitive class="lsb" id="httpd_2" provider="heartbeat" type="httpd">
  15.                                         <operations>
  16.                                                 <op id="httpd_2_mon" interval="120s" name="monitor" timeout="60s"/>
  17.                                         </operations>
  18.                                 </primitive>
  19.                         </group>
  20.                 </resources>
  21. 将上面的httpd_2部分修改说明
  22. interval="20s"
  23. timeout="10s"
  24. 即每20秒检测资源运行情况,如果发现资源不在,则尝试启动资源,如果10s后还未启动成功,则资源切换向另节点,上述的数值可以缩减的更小,否则默认的2分钟会给人一种服务down没有重启或者切换的感觉。
复制代码
注意:IPaddr使用的是ocf格式的控制脚本,路径为:/usr/lib/ocf/resource.d/heartbeat/IPaddr
如果是在/etc/init.d/下的脚步都是lsb的脚步,这个通过crm_mon是可以看到 ;crm_resource -L也是有相同的显示;
介绍一下ocf和lsb格式的区别:
LSB格式的脚本必须支持status功能,必须能接收start,stop,status,三个参数;而如果是OCF格式,则必须支持start,stop,monitor三个参数.其中status和monitor参数是用来监控资源的,非常重要.
例如LSB风格的脚本,运行./Mysql status时候,
返回值包含OK或则running则表示资源正常
返回值包含stopped或者No则表示资源不正常。
假如是OCF风格的脚本,运行./Mysql monitor时候,
返回0表示资源是正常的,
返回7表示资源出现问题.
ocf格式的启动脚本在/usr/lib/ocf/resource.d/heartbeat
lsb的脚步一般在/etc/init.d/下面
启动脚步后
通过crm_mon 可以查看资源状态;可以通过参数指定刷新时间crm_mon -i1,标识每秒刷新;

  1. #crm_mon -i1
  2. Refresh in 1s...
  3. ============
  4. Last updated: Wed Dec 10 00:57:44 2008
  5. Current DC: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0)
  6. 2 Nodes configured.
  7. 1 Resources configured.
  8. ============
  9. Node: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0): online
  10. Node: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea): online
  11. Resource Group: group_1
  12.     IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr):        Started rs11
  13.     httpd_2     (lsb:httpd):    Started rs11
复制代码
查看所有资源
#crm_resource -L
Resource Group: group_1
    IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr)
    httpd_2     (lsb:httpd)
查看资源在那个节点上运行
#crm_resource -W -r httpd_2
resource httpd_2 is running on: rs11
查看资源在cib.xml中的定义
  1. # crm_resource -x -r httpd_2
  2. httpd_2 (lsb:httpd):    Started rs11
  3. raw xml:
  4. <primitive class="lsb" provider="heartbeat" type="httpd" id="httpd_2">
  5.    <operations>
  6.      <op id="httpd_2_mon" interval="120s" name="monitor" timeout="60s"/>
  7.    </operations>
  8.    <instance_attributes id="httpd_2">
  9.      <attributes>
  10.        <nvpair name="target_role" id="httpd_2-target_role" value="started"/>
  11.      </attributes>
  12.    </instance_attributes>
  13. </primitive>
复制代码
启动/停止资源
#crm_resource -r httpd_2 -p target_role -v started
#crm_resource -r httpd_2 -p target_role -v stopped
将资源从当前节点转移到另个节点
#crm_resource -M -r httpd_2
将资源转移到指定节点
#crm_resource -M -r httpd_2 -H rs12
允许资源回到正常的节点
#crm_resource -U -r httpd_2
将资源从CRM中删除
#crm_resource -D -r httpd_2 -t primitive
将资源组从CRM中删除
#crm_resource -D -r My-DRBD-group -t group
将资源从CRM中禁用
#crm_resource -p is_managed -r httpd_2 -t primitive -v off
将资源从新从CRM中启用
#crm_resource -p is_managed -r httpd_2 -t primitive -v on
重启资源
#crm_resource -C -H rs12 -r httpd_2
检查所有节点上未在CRM中的资源
#crm_resource -P
检查指定节点上未在CRM中的资源
#crm_resource -P -H rs12
检查所有节点上未在CRM中的资源
#crm_resource -P
检查指定节点上未在CRM中的资源
#crm_resource -P -H rs12
设置资源的某个属性
#crm_resource -r httpd_2 -p email -v "lvsheat@qq.com"

  1. 网络切换测试
  2. Refresh in 1s...
  3. ============
  4. Last updated: Wed Dec 10 01:11:16 2008
  5. Current DC: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0)
  6. 2 Nodes configured.
  7. 1 Resources configured.
  8. ============
  9. Node: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0): online
  10. Node: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea): OFFLINE
  11. Resource Group: group_1
  12.     IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr):       Stopped==> Started rs12
  13.     httpd_2     (lsb:httpd):    Stopped==> Started rs12
  14. Refresh in 1s...
  15. ============
  16. Last updated: Wed Dec 10 01:11:42 2008
  17. Current DC: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea)
  18. 2 Nodes configured.
  19. 1 Resources configured.
  20. ============
  21. Node: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0): OFFLINE
  22. Node: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea): online
  23. Resource Group: group_1
  24.     IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr):        Started rs11
  25.     httpd_2     (lsb:httpd):    Started rs11
复制代码
服务切换,需要设置cib.xml中的数值

  1. Refresh in 1s...
  2. ============
  3. Last updated: Wed Dec 10 01:12:25 2008
  4. Current DC: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0)
  5. 2 Nodes configured.
  6. 1 Resources configured.
  7. ============
  8. Node: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0): online
  9. Node: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea): online
  10. Resource Group: group_1
  11.     IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr):        Started rs11
  12.     httpd_2     (lsb:httpd):    Started rs11 FAILED
  13. Failed actions:
  14.     httpd_2_monitor_5000 (node=rs11, call=13, rc=7): complete

  15. Refresh in 1s...
  16. ============
  17. Last updated: Wed Dec 10 01:12:35 2008
  18. Current DC: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0)
  19. 2 Nodes configured.
  20. 1 Resources configured.
  21. ============
  22. Node: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0): online
  23. Node: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea): online
  24. Resource Group: group_1
  25.     IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr):        Started rs11
  26.     httpd_2     (lsb:httpd):    Stopped
  27. Failed actions:
  28.     httpd_2_monitor_5000 (node=rs11, call=16, rc=7): complete
  29. Refresh in 1s...
  30. ============
  31. Last updated: Wed Dec 10 01:12:38 2008
  32. Current DC: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0)
  33. 2 Nodes configured.
  34. 1 Resources configured.
  35. ============
  36. Node: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0): online
  37. Node: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea): online
  38. Resource Group: group_1
  39.     IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr):        Started rs11
  40.     httpd_2     (lsb:httpd):    Started rs11
复制代码

  1. 宕机切换
  2. Refresh in 1s...
  3. ============
  4. Last updated: Wed Dec 10 01:13:23 2008
  5. Current DC: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0)
  6. 2 Nodes configured.
  7. 1 Resources configured.
  8. ============
  9. Node: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0): online
  10. Node: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea): online
  11. Resource Group: group_1
  12.     IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr):        Started rs11
  13.     httpd_2     (lsb:httpd):    Stopped
  14. Failed actions:
  15.     httpd_2_monitor_5000 (node=rs11, call=19, rc=7): complete
  16. Refresh in 1s...
  17. ============
  18. Last updated: Wed Dec 10 01:13:41 2008
  19. Current DC: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0)
  20. 2 Nodes configured.
  21. 1 Resources configured.
  22. ============
  23. Node: rs12 (041ec13a-a975-4813-ae93-56ca0dfc89b0): online
  24. Node: rs11 (6bccf2ee-a1b7-40d2-a875-729149e372ea): OFFLINE
  25. Resource Group: group_1
  26.     IPaddr_192_168_1_145        (ocf::heartbeat:IPaddr):        Started rs12
  27.     httpd_2     (lsb:httpd):    Started rs12
复制代码


mv httpd.conf httpd.conf.1
killall httpd

[ 本帖最后由 kns1024wh 于 2008-12-30 11:07 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-12-09 18:53 |只看该作者
很不错的文档。刚好正在搞,看看。

论坛徽章:
0
3 [报告]
发表于 2008-12-09 19:51 |只看该作者
收藏,

论坛徽章:
0
4 [报告]
发表于 2008-12-26 16:33 |只看该作者
看的一些文档咋都没有原理说明呢~~~~~~~
 如果第一次看都比较晕。

论坛徽章:
0
5 [报告]
发表于 2008-12-29 17:03 |只看该作者

回复 #4 hb_li_520 的帖子

原理说明在官方web页上有。

论坛徽章:
0
6 [报告]
发表于 2008-12-30 09:23 |只看该作者
原帖由 hb_li_520 于 2008-12-26 16:33 发表
看的一些文档咋都没有原理说明呢~~~~~~~
 如果第一次看都比较晕。



heartbeat的官方文档,个人觉得组织的不是很好,刚开始可能有些难以入门。相比之下,其他的一些开源项目官方文档要好的多,比如drbd。

论坛徽章:
3
天秤座
日期:2014-10-29 11:37:572015元宵节徽章
日期:2015-03-06 15:50:39NBA常规赛纪念章
日期:2015-05-04 22:32:03
7 [报告]
发表于 2013-05-10 18:12 |只看该作者
回复 1# kns1024wh


    httpd_2   脚本怎么写的?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP