Chinaunix

标题: AS3u5 HA的No Quorum问题 [打印本页]

作者: zhaoyf18    时间: 2006-08-22 10:36
标题: AS3u5 HA的No Quorum问题
请教一下高手:我在AS3u5的环境下配置HA,版本为: clustat -v:1.2.9,碰到了如下问题:
在其中一台机器运行 clustat -i 10,显示:
Incarnation #0
(This member is not part of the cluster quorum)

  Member             Status   
  ------------------ ----------
  gdmailserver-1     Active     <-- You are here
  gdmailserver-2     Active               

No Quorum - Service States Unknown

运行 service clumanager status,显示:
service clumanager status
clumembd (pid 12345) is running...
cluquorumd (pid 12341) is running...
clulockd (pid 12349) is running...
clusvcmgrd is stopped
Note: Service manager is not running because this member
      is not participating in the cluster quorum.

查看/var/log/messages,有如下日志:
Aug 22 10:29:23 gdmailserver-1 clulockd[12349]: <warning> Dropping connect from 192.168.123.2: Not in subnet!
Aug 22 10:29:23 gdmailserver-1 clulockd[12349]: <err> select error: No such device or address

另外
我在网上也有找到别人遇到同样的问题,但都没有明确答案,有的说可能是网络问题,但直接ping心跳IP是通的,我现在想得头都大了
作者: zhaoyf18    时间: 2006-08-22 10:38
以下为机器上的cluster.xml文件
<?xml version="1.0" ?>
<cluconfig version="3.0">
  <clumembd broadcast="yes" interval="750000" loglevel="5" multicast="no" multicast_ipaddress="" thread="yes" tko_count="20"/>
  <cluquorumd loglevel="5" pinginterval="2"/>
  <clurmtabd loglevel="5" pollinterval="4"/>
  <clusvcmgrd loglevel="5"/>
  <clulockd loglevel="5"/>
  <cluster config_viewnumber="27" key="02c7cd4fd3a3ccec559531cb13227dcb" name="Red Hat Clumanager Cluster"/>
  <sharedstate driver="libsharedraw.so" rawprimary="/dev/raw/raw1" rawshadow="/dev/raw/raw2" type="raw"/>
  <members>
    <member id="0" name="gdmailserver-1" watchdog="yes"/>
    <member id="1" name="gdmailserver-2" watchdog="yes"/>
  </members>
  <services>
    <service checkinterval="20" failoverdomain="domain1" id="0" name="uum" userscript="/root/ip_spy.sh">
      <service_ipaddresses>
        <service_ipaddress broadcast="None" id="0" ipaddress="10.0.0.6" netmask="None"/>
      </service_ipaddresses>
      <device id="0" name="/dev/cciss/c1d0p1">
        <mount forceunmount="yes" fstype="ext3" mountpoint="/mysql" options="rw"/>
      </device>
    </service>
    <service checkinterval="20" failoverdomain="domain2" id="1" name="mss0" userscript="/root/ip_spy.sh">
      <service_ipaddresses>
        <service_ipaddress broadcast="None" id="0" ipaddress="10.0.0.7" netmask="None"/>
      </service_ipaddresses>
      <device id="0" name="/dev/cciss/c1d1p5">
        <mount forceunmount="yes" fstype="ext3" mountpoint="/m0" options="rw"/>
      </device>
    </service>
    <service checkinterval="20" failoverdomain="domain1" id="2" name="mss1" userscript="/root/ip_spy.sh">
      <service_ipaddresses>
        <service_ipaddress broadcast="None" id="0" ipaddress="10.0.0.8" netmask="None"/>
      </service_ipaddresses>
      <device id="0" name="/dev/cciss/c1d1p6">
        <mount forceunmount="yes" fstype="ext3" mountpoint="/m1" options="rw"/>
      </device>
    </service>
  </services>
  <failoverdomains>
    <failoverdomain id="0" name="domain1" ordered="no" restricted="no">
      <failoverdomainnode id="0" name="gdmailserver-2"/>
    </failoverdomain>
    <failoverdomain id="1" name="domain2" ordered="no" restricted="no">
      <failoverdomainnode id="0" name="gdmailserver-1"/>
    </failoverdomain>
  </failoverdomains>
作者: zhaoyf18    时间: 2006-08-22 10:40
现在的服务情况为只有当另外一台机器的HA停掉或机器关闭,另外一台机器才能接管服务,不能实现负载均衡,每台机器各跑不同的服务
作者: zhaoyf18    时间: 2006-08-22 10:46
而且总是稍后启动HA的机器会出现No Quorum - Service States Unknown的情况,首页启动的HA就没事,请高手帮忙看看会是什么原因造成这样呢?
作者: zhaoyf18    时间: 2006-08-22 14:17
在线等,急呀,请高手们帮帮忙
作者: zhaoyf18    时间: 2006-08-22 16:08
难道高手都在忙吗?
作者: zhaoyf18    时间: 2006-08-23 11:41
难道高手现在都喜欢潜水吗?给点解决问题的思路都好啊
作者: zhaoyf18    时间: 2006-08-24 09:06
难道我已经是高手了吗?
作者: zhaoyf18    时间: 2006-08-25 16:57
问题我已经解决,原因为添加成员名用了:gdmailserver-1,换虚拟IP为成员名后一切ok
作者: zhaoyf18    时间: 2006-08-25 17:00
希望我这个问题对大家有所帮助
作者: 好好先生    时间: 2006-08-25 17:03
原帖由 zhaoyf18 于 2006-8-25 17:00 发表
希望我这个问题对大家有所帮助


谢谢分享




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2