免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: oraliy

rhel5.3的rhcs双机不断重启,求原因 [复制链接]

论坛徽章:
0
发表于 2010-07-18 18:59 |显示全部楼层
1、是的。我把post_join_delay改为到50基本上单网卡是ok的
2、可是我试过,同样的情况下,使用双网卡怎么也不成,改到60,100都不成,
    a、交换机是:H3C S5100-16P-SI L2的
    b、操作系统是企业版redhat5.3
    c、修改为100都不成,再大就没试过了
    d、测试的情况如下:
         交换机情况:两台交换机之间网线连接,DCN的两个思科的交换机各有一个端口出直联线到HTC这两台交换机上,DCN的思科交换机设置这两个端口为主备,只有一个是在用的。

         i、单网卡:
              A机eth0与B机ilo交叉线连接,IP段为1.1.1.*
              B机的eth0与A机的ilo交叉线连接,IP段为1.1.1.*
              A机的eth1与A交换机连接
              B机的eth1也是与A交换机连接
           这种情况下切换正常
        ii:双网卡绑定:
             eth2与B交换机连接,
              eth1与eth2绑定为一个bond0
          这种情况下死活不行

论坛徽章:
0
发表于 2010-07-19 11:38 |显示全部楼层
本帖最后由 hgk117 于 2010-07-19 11:54 编辑

你的bond0是不是心跳?

你在做bonding 的时候,你是不是要在
/etc/rc.d/rc.local 添加
ifenslave bond0 eth1 eth2

如果是这样的话,那就杯具了。bonding在rhel5上面不能这样做。否则在系统启动过程中,在启cman的时候,bonding还没有真正启起来,你的心跳是不通的,这时候应该就会互相fence了!

如果chkconifg不自动启动的话用service cman start 这样集群是不会有问题的,因为进入系统后bonding这时候已经是通的了。

论坛徽章:
0
发表于 2010-07-19 12:03 |显示全部楼层
对于这个问题的解决,如果确认要用bonding,那么可以这样做:

1,确认系统是否有使用xen的内核,如果有,换成普通内核再试;
2,可以将cman和rgmanager服务写到rc.local中去启动,正常启动时:
chkconfig --level 345 cman off
chkconfig --level 345 rgmanger off
这样再试;
3,调交换机,将端口收敛的速度尽可能搞快些。

论坛徽章:
0
发表于 2010-07-19 21:32 |显示全部楼层
感谢  jerrywjl 和hgk117两位大神的帮助,尤其是 jerrywjl大神,一直在帮我分析这个问题,最终的解决方案是:
1、第一个问题,直接在groub.conf中增加了acpi=off来解决,可能是redhat的bug在某个动作中触发了
2、第二个问题,我直接使用了两位大神的提示,把cman/rgmanager在自启动中去掉,而改成rc.local中增加start的代码。

非常感谢两位大神。摹拜中...

论坛徽章:
0
发表于 2010-07-20 09:29 |显示全部楼层
感谢jerrywjl ,我也是向他学的。bonding只是碰巧遇到过。

论坛徽章:
0
发表于 2010-07-20 10:22 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
发表于 2013-03-22 11:11 |显示全部楼层
回复 24# oraliy


    请问最后解决方案还是用bond的吗?

论坛徽章:
0
发表于 2013-03-27 14:43 |显示全部楼层
faith900 发表于 2013-03-22 11:11
回复 24# oraliy


EN,今天来发另一个问题 ,没想到两年以前的贴也被你找出来了,说明现在CHINAunix人气不旺啊。

论坛徽章:
0
发表于 2014-02-24 23:42 |显示全部楼层
今天我做 RHEL5.8  RHCS 也遇到  双机互相 fence 反复重启的问题。。。
两台DL580G7  连接SAN 存储  

  ii:双网卡绑定:
            
              eth0与eth1绑定为一个bond0
             A机 eth2 与B机 ILO3连接
            B机  Eth2 与B机ILO3 连接
结果fence_ilo 不能执行,选择用fence_ipmilan能手动执行,不过就是要反复切
            

论坛徽章:
0
发表于 2014-02-27 15:32 |显示全部楼层
我的RHCS高可用的问题与楼主一模一样,单网卡时通过调整 post_join_delay 解决了问题。但做了网卡bond后就只能是两个节点轮流重启的现象了。

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP