- 论坛徽章:
- 0
|
heartbeat如何监控应用层服务
一:
软件环境:HP-R200(双机),Cent OS 5.1, heartbeat2.1.3
双机环境规划:
主机 备机
主机名: sortec191 sortec192
第一块网卡(eth0)的IP(用于网络通讯) : 192.168.0.191 192.168.0.192
第二块网卡(eth1)的IP(用于心跳通讯) : 192.168.100.191 192.168.100.192
供外界访问的虚拟IP(浮动IP):192.168.0.193
网关IP: 192.168.0.100
二:
最终实现目标:
192.168.0.191,192.168.0.192双机上安装我公司开发的服务sag,并且都正常启动。通过浮动IP192.168.0.193供外界访问。
起初浮动IP192.168.0.193是绑定在主机192.168.0.191上,向外界提供sag服务;
当主机192.168.0.191上的sag死掉,浮动IP192.168.0.193会自动绑定到备机192.168.0.192上,仍然向外界提供sag服务。
当主机192.168.0.191上的sag恢复好后,浮动IP192.168.0.193又会自动绑定到主机192.168.0.191。
三:
目前已实现的情况:
硬件层的双机切换已实现了。
起初浮动IP192.168.0.193是绑定在主机192.168.0.191上,down掉主机的eth0网卡,浮动IP192.168.0.193
一段时间会自动绑定到备机IP192.168.0.192上。当恢复主机192.168.0.191的eth0网卡up,浮动IP192.168.0.193
又会自动绑定到主机192.168.0.191上。
以下是我的heartbeat的三个配置文件:
ha.cf文件内容如下:
[root@sortec191 ha.d]# cat ha.cf
node sortec191
node sortec192
debugfile /var/log/ha-debug
logfile /var/log/ha-log
logfacility local0
bcast eth1
keepalive 2
warntime 10
deadtime 20
initdead 50
udpport 694
auto_failback on
ping 192.168.0.100
respawn hacluster /usr/lib/heartbeat/ipfail
[root@sortec191 ha.d]#
haresources文件内容如下:
[root@sortec191 ha.d]# cat haresources
sortec191 192.168.0.193
[root@sortec191 ha.d]#
authkeys文件内容如下(并且赋予了600权限):
[root@sortec191 ha.d]# cat authkeys
auth 1
1 crc
[root@sortec191 ha.d]#
四:
应用层服务调试不成功(先暂且以smartd服务测试):
(1)修改haresources文件(增添smartd服务)
[root@sortec191 ha.d]# cat haresources
sortec191 192.168.0.193 smartd
[root@sortec191 ha.d]#
(2)生成/var/lib/heartbeat/crm/cib.xml文件
# /usr/lib/heartbeat/haresources2cib.py /etc/ha.d/haresources
(3)ha.cf中添加
crm on
测试结果:原先调试好的硬件层切换都不通过了(还未进行应用层smartd服务调试)。
当主机192.168.0.191的eth0网卡down掉,浮动IP192.168.0.193绑定到备机192.168.0.192上。
当92.168.0.191的eth0网卡up后,浮动IP192.168.0.193不能重新绑定到主机192.168.0.191上。
请帮忙看看,哪里出问题了。有人提出用crm或者mon去实现监控应用层服务,苦于一直没找到详细的帖子。
看看能否给个详细的实现过程或帖子。 |
|