免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 9009 | 回复: 9
打印 上一主题 下一主题

dell R710 RHCS问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-05-19 13:02 |只看该作者 |倒序浏览
本帖最后由 inhell 于 2010-05-19 13:59 编辑

核心:2.6.18-128.el5
OS:Red Hat Enterprise Linux Server release 5.3 (Tikanga)

2台DELL R710做RHCS  

fence设备选择的是DRAC,DELL的DRAC是 DRAC6,IP地址配置了,可以远程https:IP 登陆fence设备。

但是telnet fence 拒绝连接,可以ssh登陆fence ip。

我看报错是fence_drac 到fenceIP,应该是telnet操作, 这样的话肯定是失败的。

请各位看看如何处理

执行:service cman start
Starting cluster:
   Loading modules... done
   Mounting configfs... done
   Starting ccsd... done
   Starting cman... done
   Starting daemons... done
   Starting fencing... /usr/sbin/cman_tool: Cannot open connection to cman, is it running ?
failed

[FAILED]

下面是message日志

May 18 12:55:06 UAMDB1 openais[11226]: [SYNC ] This node is within the primary component and will provide service.
May 18 12:55:06 UAMDB1 openais[11226]: [TOTEM] entering OPERATIONAL state.
May 18 12:55:06 UAMDB1 openais[11226]: [CLM  ] got nodejoin message 137.32.76.101
May 18 12:55:06 UAMDB1 openais[11226]: [CLM  ] got nodejoin message 137.32.76.102
May 18 12:55:06 UAMDB1 openais[11226]: [CPG  ] got joinlist message from node 2
May 18 12:55:06 UAMDB1 ccsd[11218]: Initial status:: Quorate
May 18 12:55:07 UAMDB1 groupd[11249]: found uncontrolled kernel object rgmanager in /sys/kernel/dlm
May 18 12:55:07 UAMDB1 groupd[11249]: local node must be reset to clear 1 uncontrolled instances of gfs and/or dlm
May 18 12:55:07 UAMDB1 openais[11226]: [CMAN ] cman killed by node 1 because we were killed by cman_tool or other application
May 18 12:55:07 UAMDB1 fenced[11257]: cman_init error (nil) 111
May 18 12:55:07 UAMDB1 fence_node[11252]: agent "fence_drac" reports: failed: telnet open failed: problem connecting to "137.32.76.110", port 23: Connection refused  
May 18 12:55:07 UAMDB1 fence_node[11252]: Fence of "UAMDB1" was unsuccessful
May 18 12:55:07 UAMDB1 gfs_controld[11271]: cman_init error 111
May 18 12:55:17 UAMDB1 dlm_controld[11265]: group_init error (nil) 111

论坛徽章:
0
2 [报告]
发表于 2010-05-19 13:53 |只看该作者
难道你的RHCS中某些东西是编译的或者不是系统自带的吗?

论坛徽章:
0
3 [报告]
发表于 2010-05-19 13:57 |只看该作者
系统是DELL出厂带的,后来我通过系统添加组件,添加的cluster软件

论坛徽章:
0
4 [报告]
发表于 2010-05-19 14:14 |只看该作者
我最讨厌DELL预装的服务器,那个dkms问题多多!

要看这个问题,我需要你的硬件和网络连接环境,配置文件cluster.conf和hosts,以及所有网络方面的配置。

论坛徽章:
0
5 [报告]
发表于 2010-05-19 14:15 |只看该作者
我最讨厌DELL预装的服务器,那个dkms问题多多!

要看这个问题,我需要你的硬件和网络连接环境,配置文件cluster.conf和hosts,以及所有网络方面的配置。

论坛徽章:
0
6 [报告]
发表于 2010-05-19 17:02 |只看该作者
本帖最后由 inhell 于 2010-05-19 17:06 编辑

已经搞定,之前是因为设置了voting disk的原因,后来去掉此项配置。

目前我的oracle应用已经可以正常切换。

感觉RHCS的机制不太好,不如UNIX的双机实用,可靠。



楼上的兄弟 我也很讨厌LINUX以及solaris,个人还是喜欢用HPUX AIX。

论坛徽章:
0
7 [报告]
发表于 2010-05-19 17:13 |只看该作者
你理解错了,我说的dkms是DELL的那套东西,RHCS客观地说,理解了原理还是比较好用的。
另外从你的报错来看,fence失败和仲裁盘应该没有直接关系。

论坛徽章:
0
8 [报告]
发表于 2010-05-19 23:35 |只看该作者
现在的服务器都在更新换代,fence设备都在变,火大了。
上次有人也遇到drac6的问题,然后找到下面这篇文章,不过似乎按文档做也是不成功的,本人没条件做这个测试,有条件的兄弟给个测试结果!!!!

iDRAC6 Fencing configuration
Configure iDRAC6 Fencing
PowerEdge Dell servers using iDRAC6 will need specific parameters set in order to function properly. For the latest information on support for this in Conga, see Bug 496749.

Manually SSH to the iDRAC6
Copy the prompt that is displayed after successful login. (e.g. admin1->)
On one node only, edit /etc/cluster/cluster.conf and change each fencedevice line as follows.
Change references of the agent fence_drac to fence_drac5
Add the parameter cmd_prompt="your_iDRAC6_prompt" to each fencedevice line for each node.
where your_iDRAC6_prompt is the one you copied in step 2. (e.g. admin1->)

Example:

Find the line for each fence device. This example shows a two node cluster with DRAC fencing:

<fencedevices>               <fencedevice agent="fence_drac" ipaddr="192.168.0.101" login="root" name="node1-drac" passwd="drac_password"/>               <fencedevice agent="fence_drac" ipaddr="192.168.0.102" login="root" name="node2-drac" passwd="drac_password"/>       </fencedevices>
Change the agent to fence_drac5 and add the option cmd_prompt="admin1->" on each line:

<fencedevices>               <fencedevice agent="fence_drac5" cmd_prompt="admin1->" ipaddr="192.168.0.101" login="root" name="node1-drac" passwd="drac_password"/>               <fencedevice agent="fence_drac5" cmd_prompt="admin1->" ipaddr="192.168.0.102" login="root" name="node2-drac" passwd="drac_password"/>       </fencedevices>

论坛徽章:
0
9 [报告]
发表于 2010-06-27 01:43 |只看该作者
核心:2.6.18-128.el5
OS:Red Hat Enterprise Linux Server release 5.3 (Tikanga)

2台DELL R710做RH ...
inhell 发表于 2010-05-19 13:02



    我也遇到LZ的同样问题,操作系统是centos5.4 ,服务器是dell的r710,idrac6远程管理卡,设置好远程管理卡的ip,用户名,密码后,能ping痛,ssh登陆,https也能登陆,telnet在修改后也能用。
但是用fence_rdac或fence_rdac5命令测试后都不能成功,fence_rdac错误输出为:   warning:unable to detect DRAC version 'idrac-IGLRT2X'  failed:invalid username or password ,明明用https和ssh都能通过用户名和密码登录但是测试就是不通过。该如何啊?请教各位,忘不吝赐教。在线等。

   急啊!!!

论坛徽章:
0
10 [报告]
发表于 2010-07-03 17:53 |只看该作者
买DELL服务器的时候不要买OEM版的RH OS,买渠道的版本,这样这一类问题可以打电话给红帽中国区GSS团队获得官方技术支持, 8008102100, OEM 版OS 跟红帽市面上所销售的OS最大的区别就在于电话技术支持服务。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP