免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2556 | 回复: 8
打印 上一主题 下一主题

RHCS4的问题-(急)! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-09-28 10:05 |只看该作者 |倒序浏览
各位高人,我用RHCS4 CMAN服务启不来,如果采用GuLM方式,CMAN是可以正常启来的,服务可以对外,当然我的Fence还是有点问题。具体的配置如下:
hosts表:
127.0.0.1       localhost.localdomain   localhost  Web_A
10.2.8.245      Web_A
10.2.8.244      Web_B
10.2.8.246      Web_VIP

cluster.conf内容如下:
<?xml version="1.0" ?>
<cluster config_version="4" name="alpha_cluster">
        <fence_daemon clean_start="0" post_fail_delay="0" post_join_delay="3"/>
        <clusternodes>
                <clusternode name="Web_A" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="root" port="1"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="Web_B" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="root" port="1"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <cman expected_votes="1" two_node="1"/>
        <fencedevices>
                <fencedevice agent="fence_brocade" ipaddr="10.2.8.237" login="admin" name="root" passwd="password"/>
        </fencedevices>
        <rm>
                <failoverdomains>
                        <failoverdomain name="web_failover" ordered="1" restricted="0">
                                <failoverdomainnode name="WebA" priority="1"/>
                                <failoverdomainnode name="WebB" priority="2"/>
                        </failoverdomain>
                </failoverdomains>
                <resources>
                        <ip address="10.2.8.246" monitor_link="1"/>
                </resources>
                <service autostart="1" domain="web_failover" name="WebSphere">
                        <ip ref="10.2.8.246"/>
                </service>
        </rm>
</cluster>


具体问题如下:
第一:我用fence_brocade -a 10.2.8.237 -l admin -p password -n 1 -o enable 测试Fence Device 返回值正常。但是服务fenced启动不了。请问这用Brocade交换机做Fence Device还有其它方面的设置吗?也正如版主说的,我把REDHAT的文档都看了好多遍了,呵呵……还没有通。

第二:请大家帮忙分析指导Cman服务启动不了具体原因?
报错信息:
Sep 28 11:39:43 localhost cman_tool: gethostby*.getanswer: asked for "Web_B IN AAAA", got type "A"
Sep 28 11:39:43 localhost cman: cman_tool: Can't find broadcast address for node Web_B failed
如果还有什么没有想到的地方,请指出!感激不尽!帮忙看一下?

[ 本帖最后由 dighdypea 于 2006-9-28 11:44 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2006-09-28 12:10 |只看该作者
感谢关注,已经搞定

论坛徽章:
0
3 [报告]
发表于 2006-09-28 12:45 |只看该作者
share your experience here.

论坛徽章:
0
4 [报告]
发表于 2006-09-28 15:04 |只看该作者
我也在做一个相同的实验,所不同的是使用了另外一台设备作为GFS的文件服务器。
目前的问题也是卡在了fence这一块儿了,设备在启动fence时无法卡住了,无法正常启动。

我现在的问题是,我没有专用的fence交换机的话,如何去继续完成这个实验。
因为我查一些资料的过程中也是得知“fence是必须的,不配fence,你的集群可以跑起来,但是不算配好了,因为RHCS无法通过一个途径来阻止一个failed node和healthy node来竞争shared resource,比如 shared lun从而破坏掉上面的数据”。
谢谢!

论坛徽章:
0
5 [报告]
发表于 2006-09-28 16:00 |只看该作者
我这个是生产环境用的,如果你要做实验其实你可以脚本来完成,但我在配置FENCE DEVICE失败时,曾经做过,但前后分析我的问题出错不在FENCE,呵呵……,我回去测一下我写的那个脚本可以不,如果可以在拿上来SHOW哈。出现我这个问题的原因网卡设置IP的时候要去掉MAC地址绑定。这个在多网卡绑定做网卡负载分摊时也要去掉。

论坛徽章:
0
6 [报告]
发表于 2006-09-28 16:46 |只看该作者
如何通过脚本实现?具体的方式fence的类型是什么。盼

论坛徽章:
0
7 [报告]
发表于 2006-10-01 00:50 |只看该作者
测试中

[ 本帖最后由 dighdypea 于 2006-10-1 00:53 编辑 ]

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
8 [报告]
发表于 2006-10-01 14:21 |只看该作者

LZ
你的web_a web_b为什么都是“<device name="root" port="1"/>”

这好像不对吧。。。。。

论坛徽章:
0
9 [报告]
发表于 2006-10-04 04:16 |只看该作者
呵呵……因为我用的两台BROCADE FC交换机,肯定没有问题的。每一种FENCE设备都有测试命令,用fence_brocade -a 10.2.8.237 -l admin -p password -n 1 -o enable 测试Fence Device 返回值正常,我测过BROCADE FC交换机,原则上只能1,我测试过多个端口都不能得到正确的返回值。下面给出一最终的配置,以脚本服务的标准格式。
最终配置如下:
cat /etc/hosts:
[root@Web_A ~]# cat /etc/hosts
# Do not remove the following line, or various programs
# that require network functionality will fail.

127.0.0.1       localhost.localdomain   localhost
10.2.8.245      Web_A.localdomain      Web_A
10.2.8.244      Web_B.localdomain      Web_B
10.2.8.246      Web_VIP.localdomain   Web_VIP

cat /etc/cluster/cluster.conf
[root@Web_A ~]# cat /etc/cluster/cluster.conf
<?xml version="1.0"?>
<cluster config_version="13" name="websphere">
        <fence_daemon clean_start="0" post_fail_delay="0" post_join_delay="3"/>
        <clusternodes>
                <clusternode name="Web_A" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="IBM-2005-B16_A" port="1"/>
                                </method>
                                <method name="2">
                                        <device name="IBM-2005-B16-B" port="1"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="Web_B" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="IBM-2005-B16_A" port="1"/>
                                </method>
                                <method name="2">
                                        <device name="IBM-2005-B16-B" port="1"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <cman expected_votes="1" two_node="1"/>
        <fencedevices>
                <fencedevice agent="fence_brocade" ipaddr="10.2.8.237" login="admin" name="IBM-2005-B16_A" passwd="password"/>
                <fencedevice agent="fence_brocade" ipaddr="10.2.8.236" login="admin" name="IBM-2005-B16-B" passwd="password"/>
        </fencedevices>
        <rm>
                <failoverdomains>
                        <failoverdomain name="web_failover" ordered="1" restricted="0">
                                <failoverdomainnode name="WebA" priority="1"/>
                                <failoverdomainnode name="WebB" priority="2"/>
                        </failoverdomain>
                </failoverdomains>
                <resources>
                        <ip address="10.2.8.246" monitor_link="1"/>
                        <script file="/data/WebSphere6Express/Websphere_Cluster" name="WebSphere"/>
                        <script file="/data/IBMHTTPSERVER/IBM_Httpd_Cluster" name="Http_Server"/>
                </resources>
                <service autostart="1" domain="web_failover" name="WebSphere">
                        <ip ref="10.2.8.246">
                                <script ref="WebSphere"/>
                                <script ref="Http_Server"/>
                        </ip>
                </service>
        </rm>
</cluster>

脚本服务:
#!/bin/sh
#
#
### BEGIN INIT INFO
# Provides: IBM WebSphere 6.0
# Required-Start: $local_fs $network $syslog
# Should-Start:
# Required-Stop:
# Default-Start:  2 3 4 5
# Default-Stop: 0 6
# Short-Description: IBM WebSphere 6.0
# Description: Starts and stops IBM WebSphere 6.0
### END INIT INFO

action=$1
WEBSPHERE=/data/WebSphere6Express
WEBSPHEREWNER=root

case "$action" in
'start')
        #
        # Check to make sure there isn't another agent running already.
        # Kill and restart the agent.
        
             echo "Starting IBM WebSphere 6.0..."
        echo "RunOS:RedHat Linux Enterprise 4.2"
        echo "Author:Xu qiquan"
        echo "Date:2006-09-29"
        su - $WEBSPHEREWNER -c "$WEBSPHERE/bin/startServer.sh server1"
        echo "Start Done."
        # Setup environment and start agent.

;;


'stop')
        # Stop the agent.
        su - $WEBSPHEREWNER -c "$WEBSPHERE/bin/stopServer.sh server1"
        echo "Stop Done."
;;


"")
        # Usage message.
        echo "You must tell what you want me to do."
        echo "Usage : ./oracle [start | stop ]"
        echo " start - Start IBM WebSphere 6.0"
        echo " stop - Stop IBM WebSphere 6.0"
;;

esac

exit

以上所有均通过测试。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP