免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: wind1211
打印 上一主题 下一主题

linux cluster4.0双机配置请教 [复制链接]

论坛徽章:
0
21 [报告]
发表于 2008-08-04 13:38 |只看该作者

检查完fence后发现的问题

刚才检查了ilo fence配置,按理说应该没错,可是当节点异常掉电时 节点fence就会抱错,日志信息提示
agent "fence_ilo" reports: error: Command without TOGGLE="Yes" attribute is ignored when host power is off. power_on: unexpected error
fence "node1" failed
手动fence_ilo命令也不成功,如节点1上运行以下命令重启节点2,
[root@xjwlqywpt-itsmdb ~]# fence_ilo -a 11.88.30.201 -l Administrator -p FPM9GJBA -o reboot
error: Command without TOGGLE="Yes" attribute is ignored when host power is off.
power_on: unexpected error,,之后节点2处于关机状态。
网上查到和这个fence_ilo 的一个bug :http://www.redhat.com/archives/c ... -June/msg00169.html,我照着上面修改了/sbin/fence_ilo的
sendsock $socket, "<HOLD_PWR_BTN TOGGLE=\"Yes\" />\n";
我这边的hp ilo的firmware version是1.42,不知道是否要升级

论坛徽章:
0
22 [报告]
发表于 2008-08-04 18:19 |只看该作者

fence设备问题已经解决

已经可以通过fence_ilo 命令对节点reboot on off status
先说一下环境:ilo firmware版本为1.42,redhat4u5,cluster4.0
参考了一篇文章(http://www.mail-archive.com/linux-cluster@redhat.com/msg00097.html),更改系统中的/sbin/fence_ilo脚本,更改完后 ,同步该两节点下的/sbin/fence_ilo文件
vi打开fence_ilo文件,增加以下内容
#第280行下修改如下

        foreach my $line (@response)
        {
              if ($line =~ /FIRMWARE_VERSION\s*=\s*\"(.*)\"/) {
                       $firmware_rev = $1;
               }
                if ($line =~ /MANAGEMENT_PROCESSOR\s*=\s*\"(.*)\"/) {
                        if ($1 eq "iLO2") {
                                $ilo_vers = 2;
                               print "power_status: reporting iLO2\n" if ($verbose);
                               print "power_status: reporting iLO2 $firmware_rev\n" if ($verbose);
                        }
                }

#上述更改完保存,打开文件,定位到第365行,修改如下:
                # HOLD_PWR_BUTTON is used to power the machine off, and
                # PRESS_PWR_BUTTON is used to power the machine on;
                # when the power is off, HOLD_PWR_BUTTON has no effect.
               sendsock $socket, "<HOLD_PWR_BTN/>\n";
               if ($firmware_rev > 1.29) {
                       sendsock $socket, "<HOLD_PWR_BTN TOGGLE=\"Yes\" />\n";
               } else {
                       sendsock $socket, "<HOLD_PWR_BTN/>\n";
               }
        }
        # As of firmware version 1.71 (RIBCL 2.21) The SET_HOST_POWER command

# is no longer available. HOLD_PWR_BTN and PRESS_PWR_BTN are used
#保存上述修改,再打开该文件,定位到524行,修改成如下,其实是加了firmware_rev的声明
$action = "reboot";
$ribcl_vers = undef; # undef = autodetect
$ilo_vers = 1;
$firmware_rev = 0;

[ 本帖最后由 wind1211 于 2008-8-4 19:59 编辑 ]

论坛徽章:
0
23 [报告]
发表于 2008-08-04 20:14 |只看该作者

终于完成了双机互备测试

先将数据库服务和应用服务的recover模式设置成relocate,当双机服务启动时 ,肯定会将数据库服务和应用服务启动到一台节点上,这时在这台节点上手工停掉其中的一个服务(比如oracle),这时服务会发生切换,这样两个节点可以各跑各的应用,又可以热备自己的服务,达到“双机互备”
,过两天将配置笔记贴上来
在这里非常感谢jerrywjl    ^_^

论坛徽章:
0
24 [报告]
发表于 2008-08-19 10:38 |只看该作者
呵呵,不错啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP