免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3946 | 回复: 2
打印 上一主题 下一主题

[HACMP集群] hacmp5.1 应用监控失效 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-05-23 17:23 |只看该作者 |倒序浏览
环境:两台p650主机:AIX5200-3;盘阵S4300(8*73G;raid5);应用:domino6.5.3(a,b机各跑2分区);hacmp5.1
现象:1.某天某domino分区应用故障,导致应用宕机,因部署了应用自定义监控脚本,故HACMP本应监控到此domino分区宕机并重启应用;但HACMP只监控到此domino分区宕机(监控脚本有输出日志),而没有执行停止\启动脚本重启此domino分区
2.此后我们对hacmp的监控进行了测试(模拟应用监控脚本中的domino分区应用宕机情况),发现各domino分区(测试了a机b机各一domino分区)的监控脚本均没有监控到宕机,监控脚本没有输出日志,domino也没有重启.
相关日志:1./tmp/clstrmgr.debug
...(从13号开始,很多以下类似日志)
Fri May 19 17:59:13 PollAliasEvents: State not STABLE/RP_RUNNING or ibcasts, return
Fri May 19 17:59:43 PollAliasEvents: State not STABLE/RP_RUNNING or ibcasts, return
Fri May 19 18:00:13 PollAliasEvents: State not STABLE/RP_RUNNING or ibcasts, return
...
2./tmp/hacmp.out
...(很早就有,很多以下类似日志)
WARNING: Cluster gsmsscluster has been running recovery program '/usr/es/sbin/cluster/events/server_restart.rp' for 8004000 seconds. Please check cluster status.
WARNING: Cluster gsmsscluster has been running recovery program '/usr/es/sbin/cluster/events/server_restart.rp' for 8007600 seconds. Please check cluster status.
WARNING: Cluster gsmsscluster has been running recovery program '/usr/es/sbin/cluster/events/server_restart.rp' for 8011200 seconds. Please check cluster status.
...

请各位老大帮忙看看,谢谢.

论坛徽章:
0
2 [报告]
发表于 2006-05-24 12:35 |只看该作者
your cluster status  is unstable,pls use c-spoc recover it

论坛徽章:
0
3 [报告]
发表于 2006-05-27 18:41 |只看该作者
你们的应用自定义监控脚本怎么写的?方便的话把内容贴一下好了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP