免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: chenyajun5
打印 上一主题 下一主题

我的RHEL 3 HA cluster的两个节点都挂载了共享存储 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2005-12-16 21:49 |只看该作者
disable一个机器的网卡,它自己重启了。。重启后我恢复网卡,两个又挂上去了,晕。。

[ 本帖最后由 chenyajun5 于 2005-12-16 21:50 编辑 ]

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
12 [报告]
发表于 2005-12-16 22:20 |只看该作者
原帖由 chenyajun5 于 2005-12-16 21:49 发表
disable一个机器的网卡,它自己重启了。。重启后我恢复网卡,两个又挂上去了,晕。。


你停的是哪个网卡?

另外, 你那 httpd  配了几次?

论坛徽章:
0
13 [报告]
发表于 2005-12-17 10:48 |只看该作者
我越来越糊涂了。。我把一个机器的两个网卡都停了。。然后它重启,只停止任何一个网卡不会重启。。请教:心跳如何设置?两个机器的心跳地址分别是10.0.0.130和10.0.0.140,外部地址分别是172.16.1.130和172.16.1.140,那么cluster的成员应该是填写心跳地址(10.0.0.XXX)么?
我现在填写的是他们的外部地址
/etc/hosts文件是这样的。。
127.0.0.1       localhost.localdomain           localhost
172.16.1.140    cluster4
172.16.1.130    cluster3
10.0.0.140      cluster4
10.0.0.130      cluster3

我在一个机器上配置好了以后直接将配置文件复制到另外一个机器上。

[ 本帖最后由 chenyajun5 于 2005-12-17 10:50 编辑 ]

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
14 [报告]
发表于 2005-12-17 19:23 |只看该作者
原帖由 chenyajun5 于 2005-12-17 10:48 发表
我越来越糊涂了。。我把一个机器的两个网卡都停了。。然后它重启,只停止任何一个网卡不会重启。。请教:心跳如何设置?两个机器的心跳地址分别是10.0.0.130和10.0.0.140,外部地址分别是172.16.1.130和172.16.1. ...

应该是写心跳的网卡的.

论坛徽章:
0
15 [报告]
发表于 2005-12-17 20:16 |只看该作者
好,我再试试。。

论坛徽章:
0
16 [报告]
发表于 2005-12-21 09:10 |只看该作者

回复 8楼 nntp 的帖子

你不太明白 ha的作用,ha是保证集群中不存在任何单点故障。split brain是任何HA软件也无法避免的,这时候只能通过提高心跳的冗余度来减少split brain的存在。而且在split brain发生后也有很多情况可以避免,比如stonith(powerswith就是一种stonith机制),scsi reserve,hang check timer(watchdog)等。我没有看到heartbeat和rh clumanager在处理split brain的方式上有啥不同,heartbeat好像更弱一些,再者,他也有heartbeat-stonith的包

论坛徽章:
0
17 [报告]
发表于 2005-12-21 09:13 |只看该作者
lz的问题在于 vmware里面的share disk不会在两个节点实时同步,没有办法做quorum盘

论坛徽章:
0
18 [报告]
发表于 2005-12-21 14:54 |只看该作者
原帖由 jamesb 于 2005-12-21 09:10 发表
你不太明白 ha的作用,ha是保证集群中不存在任何单点故障。split brain是任何HA软件也无法避免的,这时候只能通过提高心跳的冗余度来减少split brain的存在。而且在split brain发生后也有很多情况可以避免,比如s ...


请不要一上来就对我对HA的理解作莫名的评价,我仍旧在长期学习HA,只要ha技术不停顿,我想我会一直处于"不明白"的状态。相信大家都是这样的.

我从来没有说过brain split可以避免的,有这种观点的人显然是很可笑的,brain split是HA集群成员在工作的时候发生异常的一种状态.

最简单的方法就是用你说的提高心跳的冗余度来做,nic bonding 基本上是大多数商业集群的要求. 低端得还会要求加上一根null modem线来做tty上的heartbeat.

但是这种架构并不是好的解决之道,quorum lun/disk/server 是另外一种思路来解决问题.

论坛徽章:
0
19 [报告]
发表于 2005-12-21 14:58 |只看该作者
原帖由 jamesb 于 2005-12-21 09:13 发表
lz的问题在于 vmware里面的share disk不会在两个节点实时同步,没有办法做quorum盘


lz的问题在于采用RHEL 在vmware里面的quorum 状态不正常。这个问题是软件造成的,不是技术固有的问题.

但是linux cluster 做在vmware里面用shared disk 做quroum lun 是一件很简单和平常的事情。如果你听说过SGLX 的话.
我的大多数用户程序的HA环境的移植评估,都是在我的一台pc上完成的, Althon64 3000+, 2GB, 160G SATA raid. SLES9 SP2, vmware GSX3.1, HP MC/SG for linux, oracle toolkit, apache toolkit, mysql toolkit, sap toolkit, nfs toolkit.

论坛徽章:
0
20 [报告]
发表于 2005-12-21 15:02 |只看该作者
这里看到的vmware share disk就不正常能够,你在一段写的数据进去,这边需要过一段时间才能看到,不知道你有什么办法解决。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP