- 论坛徽章:
- 0
|
原帖由 chenyajun5 于 2005-12-15 13:21 发表
我的是两个节点的,是不是我cluquorumd有问题。我不明白Disk Tiebreaker和 network TieBreaker有啥区别,好像两节点的ha cluster需要使用network TieBreaker,那么那个ip该怎么设置呢?
你的问题实际上回答了很多其他急冲冲要装RHCS的人的问题.
我一直说不管RHCS还是 linux-ha 也好,采用的都是不太可靠的 Tiebreaking机制. 为什么RHCS v4你们看到了 PowerSwitch? 其实powerswitch从RHCS v2.1的时候就存在了,只不过在系统配置中一直保留不用而已. 5年前我研究Kimberlite 的时候就发现实际上,如果在2个node的HA集群环境中,如果发生heartbeat出现故障,互相不知对方节点状态的情况下,按照竞选机制,每一个node都要重新以自己为主建立一个新的集群,但是只有50%的票选,在这个时候,所有原本有序控制的共享资源,比如存储,漂移IP之类的,全部会被竞抢,出现了所谓的brain-split. Kimberlite很早就看到了这个问题,和我们熟悉的linux-ha.org的项目一样,因为自身架构上带来的缺陷,只能通过2个手段来尽可能减少这种问题,一个手段就是linux-ha.org很有代表性的heartbeat 子项目,这也是linux-ha.org把heartbeat放在了一个很主要地位的原因,另外一个有代表性的手段就是kimberlite的powerswitch. 市面上其他的低端linux HA产品,比如rose ha之类的产品,在解决brainsplit的道路上,无外乎采用了这两种手段之一。
发生brainsplit的时候, kimberlite 就通过一个后台service, 强行控制一个node的powerswitch 然后poweroff一个node, 即便这个node reboot之后,也不会正常启动cluster service, 这样就保证了出现 50-50的资源竞抢的时候,可以保护共享资源,并且让一个优先节点来重组cluster.
network tiebreaker 是很多高端ha系统广泛采用的方法,通过把一个仲裁单位放在网络的一个设备上(pc, pc server, server, network device),出现50-50的竞抢之后,让网络上的这个设备来投票参与竞抢,2对1的选择的结果永远不会出现50-50的brain-split.所以也比较可靠。
另外一种稍微差一点的做法是用Quorum LUN/disk, 一般用LUN的会多一点,这样quorum不会出现单点故障. 微软的MSCS用的就是这种方法。相对前面的network tiebreak来说 lun/disk tierbreaker成本相对比较低,可靠性也比较差.
你的这个httpd的问题,我觉得首先要做的就是你要仔细阅读手册,不要有遗漏。第二个是要严格检查httpd service的配置. 不要有任何违反系统要求的配置项存在。 看我置顶的帖子,我认为大部分的看似奇怪的问题,都是因为配置和环境与程序本身的要求不一致造成的。软件本身的缺陷也是要考虑的因素之一。 |
|