免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: zhoufuhua
打印 上一主题 下一主题

出差在外 紧急求助 REDHAT AP5.1 CLUSTER HP ILO FENCE 问题 [复制链接]

论坛徽章:
0
21 [报告]
发表于 2009-04-23 22:24 |只看该作者
一、对于机器重启动,可能原因有两个:
1、网络交换机,对于有些交换机型号(如CISCO)必须设定PORTFAST(可能是这么拼,我对交换机不熟悉)。而有些品牌的型号(如TPLINK)缺省就设定了PORTFAST。
2、fence_ilo的版本问题。我用RHCS 4.5,就出现了不断重启,下载了最新4.7的fence包,才解决的。
再详细说一下有关fence版本的问题,
在4.5中,fence_ilo xxxx -o off能正常关机,但fence_ilo xxxx -o on或者-o restart报错,不能重新启动机器。
假设A机正常工作,B机关着,那么A机的fenced服务会不断发fence信号(相当于 fence_ilo xxx -o restart,都是通过fence agent来发出的),让B机重启,但由于fence 不能在OFF的状态把B机启动,所以会一直报fence failure。而手动启动B机,刚启动,A机的fence信号又发过来,让B机RESTART,结果就是B机OFF以后不能START。
注:A机发fence 信号的周期是10秒左右,0秒发出fence 信号(fence node "nodename"),5秒就能返回失败信号(fence  "nodename" failure),10秒再发出fence信号。以上过程在B机未能重启的情况下,一直重复。

二、fence_ilo 报“no route to host"错误
10楼遇到过此问题的。
解决这个问题要检查几个地方:
1、硬件连接:对于HP ILO作为fence 设备不能两个ILO直连。(IBM BMC好象可以)。对HP的ILO,它的fence信号是通过ETHO发出的,而不是ILO端口,所以不能直连。

2、配置:在fence设备配置中,HOSTNAME必须是ILO端口的地址或NAME,如果是NAME,在HOSTS文件中必须设定。
如果能在A机上PING通B机的ILO端口,就应该不会出现这个错误了。

论坛徽章:
0
22 [报告]
发表于 2010-02-03 16:13 |只看该作者
On Cisco swither, you must open portfast and mulitcast.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP