免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 1843 | 回复: 15
打印 上一主题 下一主题

[高级应用] 我倒,HA居然stop不下来 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2003-03-17 13:06 |只看该作者 |倒序浏览
<Test01>;/ #lssrc -g cluster
Subsystem         Group            PID     Status
clstrmgr         cluster          16804   stopping

一直是stopping,/tmp/hacmp.out也不写,vg也不下来,service地址也不改回去,总之一点都没动,还没碰到过这种怪问题呢。

我可以kill掉这个PID伐?

论坛徽章:
0
2 [报告]
发表于 2003-03-17 13:17 |只看该作者

我倒,HA居然stop不下来

有个FORCE shutdown啊,不过不释放资源。
配置得有问题。配置得不好还不如单机可靠呢:(

论坛徽章:
0
3 [报告]
发表于 2003-03-17 13:42 |只看该作者

我倒,HA居然stop不下来

哦,我force下来了。
不过很奇怪,我现在2台单机起cluster,一台似乎没问题,另外一台,起倒是起来了。
lssrc -g cluster,看到都active,但不写/tmp/hacmp.out
然后我当它是成功起来了,
在主机上Test01,smit clstop,然后选takeover
主机lssrc -g cluster,状态一直为stopping,vg和service地址都不动,/tmp/hacmp.out也一点东西都没有,
备机/tmp/hacmp.out也没动

我不明我什么地方配错了伐,备机在屏幕上报一个错,说是clstrmgr 16XXX这个进程一直mwirte to jim 出错,不明是什么东西。

我拓扑和resouse同步都OK了,没问题阿。

请指教

多谢多谢
要不什么包少装了?? stop的包没装??
多谢多谢

论坛徽章:
0
4 [报告]
发表于 2003-03-17 13:56 |只看该作者

我倒,HA居然stop不下来


config_too_long[79] /bin/echo WARNING: Cluster Test has been running event 'node
_up Test02' for 1260 seconds. Please check event status.
config_too_long[79] 1>; /dev/console
config_too_long[80] sleep 30

备机的/tmp/hacmp.out一直报以上这条消息,每30S一次

论坛徽章:
0
5 [报告]
发表于 2003-03-17 15:27 |只看该作者

我倒,HA居然stop不下来

备机不正常。你不开主机,单开备机起HACMP试试。

论坛徽章:
0
6 [报告]
发表于 2003-03-17 15:31 |只看该作者

我倒,HA居然stop不下来

检查拓扑,service ip和standby ip是不是在同一个子网?

论坛徽章:
0
7 [报告]
发表于 2003-03-17 15:31 |只看该作者

我倒,HA居然stop不下来

我也觉得备机不正常
我单开备机的结果是
哦,我的HA 是cascading的
单开备机的结果是,备机没有service地址,没有varyon的vg,除了rootvg
好象没发生过cluster start一样,但lssrc -g cluster里的status却是active

论坛徽章:
0
8 [报告]
发表于 2003-03-17 15:34 |只看该作者

我倒,HA居然stop不下来

备机/tmp/cm.log是这样的
jil_open_heartbeat_path: A file descriptor does not refer to an open file.
mwrite: A file descriptor does not refer to an open file.
mwrite: A file descriptor does not refer to an open file.
mwrite: A file descriptor does not refer to an open file.
mwrite: A file descriptor does not refer to an open file.
mwrite: A file descriptor does not refer to an open file.
short mwrite (0/29)

主机的/tmp/cm.log是这样的
JIM ERROR (Test,pid=16546) hbInit failure on remote adapter 10.5.26.102
JIM ERROR (Test,pid=16546) hbInit failure on remote adapter 192.168.1.2
JIM ERROR (Test,pid=16546) hbInit failure on remote adapter 10.5.26.102
JIM ERROR (Test,pid=16546) hbInit failure on remote adapter 192.168.1.2
JIM ERROR (Test,pid=16546) hbInit failure on remote adapter 10.5.26.102
JIM ERROR (Test,pid=16546) hbInit failure on remote adapter 192.168.1.2
JIM ERROR (Test,pid=16546) hbInit failure on remote adapter 10.5.26.102
JIM ERROR (Test,pid=16546) hbInit failure on remote adapter 192.168.1.2


我测试过心跳线没有问题,ha里我也加了2个心跳线的tty,想不出有什么问题。

论坛徽章:
0
9 [报告]
发表于 2003-03-18 11:50 |只看该作者

我倒,HA居然stop不下来

我把resouce 改成rotating就可以,但是cascading就是不行,郁闷。

论坛徽章:
0
10 [报告]
发表于 2003-03-18 11:58 |只看该作者

我倒,HA居然stop不下来

clverify做一下试一下。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP