免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3235 | 回复: 6
打印 上一主题 下一主题

cluster 同时启动的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-08-01 22:04 |只看该作者 |倒序浏览
前两天,磕磕绊绊的做了一遍cluster3.1,一切正常;不过有个奇怪的现象,就是,如果reboot一台的时候,另外一台机器也会重新启动,不管是在主机上操作还是在备机上操作。另外,init0同样作用两台机器,init6却作用一台机器,百思不解,郁闷ing。\r\n\r\n此外祝福一下蜘蛛,原来的时候,曾收到蜘蛛的热心帮助,好人好报,快快康复,大家都在等你。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
2 [报告]
发表于 2006-08-01 22:09 |只看该作者
恐怕要把你的配置情况介绍一下先。\r\n偶做cluster 3.1时好象没碰到这情况。另外,init 6就是reboot啊,两者作用不一样吗?

论坛徽章:
0
3 [报告]
发表于 2006-08-01 22:29 |只看该作者
这就是quorum device惹的祸,看看你的scstat -q的output

论坛徽章:
0
4 [报告]
发表于 2006-08-01 22:52 |只看该作者
-- Quorum Summary --\r\n\r\n  Quorum votes possible:      4\r\n  Quorum votes needed:        3\r\n  Quorum votes present:       4\r\n\r\n楼上的,能不能给详细分析一下,谢了。\r\n\r\n-- Quorum Votes by Node --\r\n\r\n                    Node Name           Present Possible Status\r\n                    ---------           ------- -------- ------\r\n  Node votes:       JDSN-FIR            1        1       Online\r\n  Node votes:       JDSN-SEC            1        1       Online\r\n\r\n\r\n-- Quorum Votes by Device --\r\n\r\n                    Device Name         Present Possible Status\r\n                    -----------         ------- -------- ------\r\n  Device votes:     /dev/did/rdsk/d1s2  1        1       Online\r\n  Device votes:     /dev/did/rdsk/d2s2  1        1       Online

论坛徽章:
0
5 [报告]
发表于 2006-08-01 22:56 |只看该作者
Philmoon  \r\n正因为init6和reboot一样,我才郁闷呢。

论坛徽章:
0
6 [报告]
发表于 2006-08-02 09:49 |只看该作者
关于quorum device 的介绍\r\n4.3  quorum device \r\n    在特定情况下,例如两节点的Cluster中,当节点间的私网连接失败,且节点们仍然是Cluster中的成员。Sun Cluster需要在一个物理设备的帮助下来解决CMM quorum的问题,这个物理设备就是quorum device。 \r\n    quorum device仅仅是一个在安装过程中指定的磁盘或控制器。quorum device是一个逻辑概念,一个硬件被指定为quorum device与否对于其使用上并没有任何影响。Sun 的官方资料中,SSVM不允许一个磁盘的分区(如c1t1d1s5)作为一个独立的DG-disk group(但实际上可以实现),所以一个完整的磁盘和它的丛(镜像)被要求用作quorum device。 \r\nquorum device确保在任何一个时间点,仅仅只能有一个节点可以更新共享磁盘。如果双机间的心跳信号丢失,就无法确保由那个节点访问共享磁盘了,这时就需要用到quorum device。每个节点只有在能够确定它是多数意见quorum中的一员时,才会去试图更新共享磁盘数据。节点们进行一个投票,或quorum,去决定哪些节点留在Cluster中。每一个节点都要确定它能和多少节点进行通信(当然是通过私网连接)。如果它能够和Cluster中超过一半的节点通信,他就成为quorum的一员,并且被同意继续保留Cluster成员的身份。如果不能称为quorum中的一员,则自动退出。 \r\n    quorum device则作为一个第三方投票去防止投票平局的出现。例如在双机中的心跳信号丢失,每个节点都要去争取quorum device的支持。这样,争取到quorum device的节点和没有争取到quorum device节点的得票数就是2:1,成为quorum中的一员的节点掌控了共享磁盘后,重新启动它的Cluster,而另外一个节点则退出(这种情况下,Cluster中只有一个成员,但Cluster依然存在)。 \r\n    实际上,在每一个Cluster重新配置(注意,这个配置不是安装时的配置,而是如Cluster中有某个成员加入、退出或逻辑机切换等操作,我们都称为Cluster需要重配置)之前,一组节点和quorum device都会进行一次投票,以确定得到一个新的系统配置。只有quorum成功了,重新配置进程才会进行。Cluster重新配置成功后,仅仅是quorum中的一员的节点才会继续留在Cluster中。 \r\n    quorum device的失败类似于两节点Cluster中的一个节点失败的情况。虽然quorum device的失败并不会导致服务的切换,但它确实会降低HA的性能,因为系统将不再冗余将来心跳失败的故障。 \r\n    一个失败的quorum device能够在Cluster处于运行过程中被重配置或更换。在此过程中,只要没有其他部件发生故障,Cluster将保持正常运行状态。 \r\n    如果双机间心跳信号丢失,两个节点都会试图启动Cluster重配置流程,使自己成为Cluster中唯一一个节点(因为双机均相互失去心跳)。第一个成功保留住quorum device的配置的节点新成只有自己的单节点的群集,而另一个不能保留住quorum device的节点退出。 \r\n    如果心跳信号还没有恢复,就试图启动一个已经退出的节点上,这个已退出的节点(仍然不能够和Cluster中的节点通信)试图预约quorum device,因为他认为自己才是Cluster中的成员。这个尝试将会失败,因为对quorum的约定权被令外一个节点所保持。这个措施能有效地阻止该节点形成另外一个Cluster。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
7 [报告]
发表于 2006-08-02 12:15 |只看该作者
原帖由 jdsnhan 于 2006-8-1 22:56 发表\r\nPhilmoon  \r\n正因为init6和reboot一样,我才郁闷呢。
\r\n\r\n怀疑是否是“全局文件系统”惹的祸?我做的那次只用了一个分区7(系统要求的),其他地方没用全局文件系统。单台reboot并不影响对方。\r\n\r\n补充:是failover方式
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP