免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: oioilu
打印 上一主题 下一主题

cman 无法启动 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2008-10-26 23:30 |只看该作者

回复 #10 oioilu 的帖子

openais[13904]: [CMAN ] cman killed by node 2 for reason 2


I try to find out what is reason 2 you got, not lucky for now.

My configuration
[root@s12 ~]# lsof -i UDP:5405
COMMAND  PID USER   FD   TYPE DEVICE SIZE NODE NAME
aisexec 2367 root    6u  IPv4   8200       UDP 239.192.2.98:netsupport
aisexec 2367 root    8u  IPv4   8202       UDP s12.example.com:netsupport
[root@s12 ~]# cat /etc/hosts
# Do not remove the following line, or various programs
# that require network functionality will fail.
127.0.0.1       localhost.localdomain   localhost
::1     localhost6.localdomain6 localhost6
192.168.0.12    s12.example.com s12


from this
[root@cms2 ~]# cat /etc/hosts
# Do not remove the following line, or various programs
# that require network functionality will fail.
127.0.0.1       localhost.localdomain   localhost       cms2.Guangdong
::1     localhost6.localdomain6 localhost       cms2.Guangdong6
192.168.201.1 cms1
192.168.201.2 cms2


to

[root@cms2 ~]# cat /etc/hosts
# Do not remove the following line, or various programs
# that require network functionality will fail.
127.0.0.1       localhost.localdomain   localhost
::1     localhost6.localdomain6 localhost6
192.168.201.1 cms1.Guangdong     cms1
192.168.201.2 cms2.Guangdong     cms2



do
hostname
service cman restart
lsof -i UDP:5405


what about your ifcfg-ethx/bondx and ifcfg-ethx:y (floating ip)?

[ 本帖最后由 gl00ad 于 2008-10-26 23:40 编辑 ]

论坛徽章:
0
12 [报告]
发表于 2008-10-27 10:24 |只看该作者
我更改了hosts文件后,cman重启还是fence设备报错。log显示依然是"[CMAN ] cman killed by node 2 for reason 2 "

使用lsof -i UDP:5405,已经没有显示,表明端口已经空闲。

以下是ifcfg的配置。


  1. [root@cms2 network-scripts]# more ifcfg-bond0
  2. DEVICE=bond0
  3. BOOTPROTO=none
  4. IPADDR=61.8.165.36
  5. NETMASK=255.255.255.240
  6. ONBOOT=yes
  7. TYPE=Ethernet
  8. GATEWAY=61.8.165.33
  9. USERCTL=no
  10. [root@cms2 network-scripts]# more ifcfg-eth0
  11. BOOTPROTO=none
  12. DEVICE=eth0
  13. ONBOOT=yes
  14. IPADDR=192.168.201.2
  15. NETMASK=255.255.255.0
  16. HWADDR=00:1e:4f:39:91:92
  17. TYPE=Ethernet
  18. USERCTL=no
  19. IPV6INIT=no
  20. PEERDNS=yes
  21. [root@cms2 network-scripts]# more ifcfg-eth1
  22. BOOTPROTO=none
  23. DEVICE=eth1
  24. ONBOOT=yes
  25. MASTER=bond0
  26. SLAVE=yes
  27. TYPE=Ethernet
  28. [root@cms2 network-scripts]# more ifcfg-eth2
  29. BOOTPROTO=none
  30. DEVICE=eth2
  31. ONBOOT=yes
  32. MASTER=bond0
  33. SLAVE=yes
  34. TYPE=Ethernet
复制代码

[ 本帖最后由 oioilu 于 2008-10-27 11:15 编辑 ]

论坛徽章:
0
13 [报告]
发表于 2008-10-27 17:58 |只看该作者
I get an official answer from a Redhat Guy:

It means you have a very old version of cman that needs updating
That message as from 5.0 and lots of things have been fixed (including
that error) since then .

Chrissie

Reason "2" is that someone issued a cman_tool kill command on another
node. So it's nothing wrong with the cluster that has caused that message.

Chrissie

[ 本帖最后由 oioilu 于 2008-10-28 17:51 编辑 ]

论坛徽章:
0
14 [报告]
发表于 2008-10-27 21:48 |只看该作者

回复 #13 oioilu 的帖子

congradulation and thanks for sharing!

论坛徽章:
0
15 [报告]
发表于 2008-10-27 22:17 |只看该作者
原帖由 oioilu 于 2008-10-27 17:58 发表
I get an official answer from a Redhat Guy:




谁说的?!我怎么不知道RHEL5上有这样的问题?

首先,如果你的系统和所使用的集群软件来自同一个光盘,那么版本匹配方面不会有问题,即便RHEL5的GA版本有这样那样的毛病,但是还不至于有这样严重的问题。
所以你能否尽量将情况描述清楚一些?
例如:
你的物理拓扑结构是怎样的?然后现在的具体问题是什么?你按照什么样的步骤进行了排查?!

我建议你将上述情况说清楚,然后将两台设备的时间调整一致,然后同时重启,之后将你的故障现象重现一次之后在两台设备上各运行一次sosreport命令。
最后将两台设备的sosreport产生的bz2文件提供出来,我有时间会帮你看看。

论坛徽章:
0
16 [报告]
发表于 2008-10-27 22:34 |只看该作者

回复 #15 jerrywjl 的帖子

this is mine, how to find cman version?

[root@s12 ~]# cman_tool version
6.1.0 config 17
CMAN 2.0.84 (built May 25 2008 02:03:53) started

His
CMAN 2.0.60 (built Jan 23 2007 12:42:29) started

论坛徽章:
0
17 [报告]
发表于 2008-10-27 22:42 |只看该作者
原帖由 gl00ad 于 2008-10-27 22:34 发表
this is mine, how to find cman version?


His
  


看所安装的rpm包也行啊!rpm -q cman

论坛徽章:
0
18 [报告]
发表于 2008-10-27 22:48 |只看该作者

回复 #17 jerrywjl 的帖子

his

CMAN 2.0.60 (built Jan 23 2007 12:42:29) started

in the log file in the first page

论坛徽章:
0
19 [报告]
发表于 2008-10-27 23:45 |只看该作者
原帖由 jerrywjl 于 2008-10-27 22:17 发表



谁说的?!我怎么不知道RHEL5上有这样的问题?

首先,如果你的系统和所使用的集群软件来自同一个光盘,那么版本匹配方面不会有问题,即便RHEL5的GA版本有这样那样的毛病,但是还不至于有这样严重的问题 ...


我的现在已经是生产环境了,不可能为了这个而重起的,毕竟不是研究性质。

另外redhat的人员联系方式为:Christine Caulfield <ccaulfie@redhat.com>  (Red Hat)

[ 本帖最后由 oioilu 于 2008-10-27 23:47 编辑 ]

论坛徽章:
0
20 [报告]
发表于 2008-10-28 17:50 |只看该作者
Update from Redhat ppl:

Reason "2" is that someone issued a cman_tool kill command on another
node. So it's nothing wrong with the cluster that has caused that message.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP