免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4534 | 回复: 4
打印 上一主题 下一主题

RHCS 主心跳线拔掉后,被fence关机了 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-13 15:13 |只看该作者 |倒序浏览
本帖最后由 faith900 于 2013-09-16 18:18 编辑

RHEL  5.8
HBWH-PS--DB02是主服务器,拔掉心跳线后,主服务器关机,业务切到HBWH-PS--DB01状态正常
正常应该是重启吧db01???????????
怎么配置cluster.conf只重启
机器hpdl380

Jan 13 12:41:41 HBWH-PS--DB01 openais[14333]: [CLM  ] got nodejoin message 192.168.5.1
Jan 13 12:41:41 HBWH-PS--DB01 kernel: dlm: closing connection to node 2
Jan 13 12:41:41 HBWH-PS--DB01 openais[14333]: [CPG  ] got joinlist message from node 1
Jan 13 12:41:41 HBWH-PS--DB01 fenced[14377]: failover-DB02 not a cluster member after 0 sec post_fail_delay
Jan 13 12:41:41 HBWH-PS--DB01 fenced[14377]: fencing node "failover-DB02"
Jan 13 12:41:47 HBWH-PS--DB01 fenced[14377]: agent "fence_ipmilan" reports: Rebooting machine @ IPMI:192.168.5.12...Failed
Jan 13 12:41:47 HBWH-PS--DB01 fenced[14377]: fence "failover-DB02" failed
Jan 13 12:41:52 HBWH-PS--DB01 fenced[14377]: fencing node "failover-DB02"
Jan 13 12:41:53 HBWH-PS--DB01 fenced[14377]: fence "failover-DB02" success
Jan 13 12:41:54 HBWH-PS--DB01 clurgmgrd[14420]: <notice> Starting stopped service service:MALS-DB-SERVICE
Jan 13 12:41:56 HBWH-PS--DB01 avahi-daemon[5103]: Registering new address record for 192.168.0.88 on bond0.


============
   <?xml version="1.0" ?>
<cluster alias="DBcluster" config_version="16" name="DBcluster">
        <fence_daemon post_fail_delay="0" post_join_delay="3"/>
        <clusternodes>
                <clusternode name="failover-DB01" nodeid="1" votes="1">
                        <fence>
                                <method name="1">
                                        <device lanplus="1" name="IPMI-FENCE-DB01"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="failover-DB02" nodeid="2" votes="1">
                        <fence>
                                <method name="1">
                                        <device lanplus="1" name="IPMI-FENCE-DB02"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <cman broadcast="yes"/>
        <fencedevices>
                <fencedevice agent="fence_ipmilan" auth="md5" ipaddr="192.168.5.11" login="mals-ilo" name="IPMI-FENCE-DB01" passwd="wys$"/>
                <fencedevice agent="fence_ipmilan" auth="md5" ipaddr="192.168.5.12" login="mals-ilo" name="IPMI-FENCE-DB02" passwd="wys$"/>
        </fencedevices>
        <rm>
                <failoverdomains>
                        <failoverdomain name="MALS-DB" ordered="1" restricted="1">
                                <failoverdomainnode name="failover-DB01" priority="1"/>
                                <failoverdomainnode name="failover-DB02" priority="1"/>
                        </failoverdomain>
                </failoverdomains>
                <resources>
                        <ip address="192.168.0.88/24" monitor_link="1"/>
                        <fs device="/dev/oracledatevg/oradatalv" force_fsck="0" force_unmount="1" fsid="15674" fstype="ext3" mountpoint="/oradata" name="oradata" option
s="" self_fence="0"/>
                        <fs device="/dev/backupvg/backuplv" force_fsck="0" force_unmount="1" fsid="43259" fstype="ext3" mountpoint="/backup" name="bakcup" options="" se
lf_fence="0"/>
                        <oracledb home="/home/oracle/product/10.2.0/db_1" name="mals70" type="base" user="oracle" vhost="HBWH-PS-DB"/>
                </resources>
                <service autostart="1" domain="MALS-DB" name="MALS-DB-SERVICE" recovery="relocate">
                        <ip ref="192.168.0.88/24">
                                <fs ref="oradata">
                                        <oracledb ref="mals70"/>
                                </fs>
                                <fs ref="bakcup"/>
                        </ip>
                </service>
        </rm>
        <cman expected_votes="1" two_node="1"/>
</cluster>


=============

fence_ipmilan   测试对端正常
[root@HBWH-PS--DB01 ~]#  fence_ipmilan -v -P -A md5 -a  192.168.5.12 -l mals-ilo -p wys$ -o status
Getting status of IPMI:192.168.5.12...Spawning: '/usr/bin/ipmitool -I lanplus -H '192.168.5.12' -U 'mals-ilo' -A 'md5' -P 'wys$' -v chassis power status'...
Chassis power = On
Done

论坛徽章:
0
2 [报告]
发表于 2013-09-16 18:18 |只看该作者
没人知道吗!!!!!!!!

论坛徽章:
0
3 [报告]
发表于 2013-09-21 18:21 |只看该作者
本帖最后由 nntp 于 2013-09-21 18:22 编辑

你是看着官方的手册配的么?

论坛徽章:
0
4 [报告]
发表于 2013-09-22 15:23 |只看该作者
回复 3# nntp


    版主,请问下,正常情况下,down掉db1的bond心跳口
业务是会切换到db2,并且db2是fence关机db1吗,还是重启db1???

加了power_wait="4"  ,但是等了4秒还是不开机??

           <fencedevice agent="fence_ipmilan" auth="" ipaddr="192.168.5.11" lanplus="1" login="administrator" name="IPMI-FENCE-DB01" passwd="6Gfdwys$" power_wait=
"4" privlvl="operator"/>

论坛徽章:
1
IT运维版块每日发帖之星
日期:2015-07-05 22:20:00
5 [报告]
发表于 2013-09-25 21:09 |只看该作者
<service autostart="1" domain="MALS-DB" name="MALS-DB-SERVICE" recovery="relocate">
你这里配置的是relocate,你在图形界面里配置看看,这里还有别的选项,比如restart,如果选择restart,还有次数选择,默认我记得好像是3,也就是3次restart不行就fence节点,接管资源。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP