免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2948 | 回复: 3
打印 上一主题 下一主题

[HACMP集群] 求助 一台机器自动宕机 hacmp 产生force 事件 求原因 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-09-09 19:58 |只看该作者 |倒序浏览
一台机器优于温度过高, 宕机了, HACMP 产生 forced  events,        没有切换   

想问下, HACMP 什么情况下会产生force 事件 而不产生 takeover 事件??

怎么设置才能当一台 宕机后, HACMP自动产生takeover 自动切换到备机上??  手动 takeover 切换没问题的!!


谢谢!!!

HACMP Event Summary
Event: /usr/es/sbin/cluster/events/check_for_site_down p550a forced
Start time: Sun Sep  7 09:43:52 2008

End time: Sun Sep  7 09:43:52 2008

Action:                Resource:                        Script Name:
----------------------------------------------------------------------------
No resources changed as a result of this event
----------------------------------------------------------------------------

Sep  7 09:43:52 EVENT START: node_down p550a forced

:node_down[79] [[ high = high ]]
:node_down[79] version=1.45.1.1
:node_down[80] :node_down[80] cl_get_path
HA_DIR=es
:node_down[82] export NODENAME=p550a
:node_down[83] export PARAM=forced
:node_down[85] UPDATESTATDFILE=/usr/es/sbin/cluster/etc/updatestatd
:node_down[94] STATUS=0
:node_down[96] [[ -z  ]]
:node_down[97] EMULATE=REAL
:node_down[100] set -u
:node_down[102] ((  2 < 1  ))
:node_down[107] rm -f /tmp/.RPCLOCKDSTOPPED
:node_down[108] rm -f /usr/es/sbin/cluster/etc/updatestatd
:node_down[110] [[ forced = forced ]]
:node_down[110] [[ p550a = p550a ]]
:node_down[110] [[ REAL = EMUL ]]
:node_down[119] clchdaemons -r -d clstrmgr_scripts -t resource_locator
:node_down[124] cl_echo 3048 node_down : p550a forced down. Exiting immediately.\n node_down p550a
:cl_echo[49] version=1.13
:cl_echo[98] HACMP_OUT_FILE=/tmp/hacmp.out
Sep  7 2008 09:43:52 node_down : p550a forced down. Exiting immediately.
:node_down[125] return 0
Sep  7 09:43:53 EVENT COMPLETED: node_down p550a forced 0

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
2 [报告]
发表于 2008-09-09 22:31 |只看该作者
hacmp在机器关机的时候执行不执行接管动作,在/usr/es/sbin/cluster/etc/rc.shutdown里是会有定义的,可能你的环境问题导致的宕机应验其中了的一种情况。

附/usr/es/sbin/cluster/etc/rc.shutdown部分内容:
  1. ###############################################################################
  2. #   We're doing a shutdown because of an EPOW condition
  3. ###############################################################################
  4. if [[ $EPOW_SHUTDOWN == true ]] ; then
  5.     ###########################################################################
  6.     #   We attempt to do a 'graceful with takeover' shutdown, so that the
  7.     #   resource groups get taken over when this node fails.  Note that this
  8.     #   is in no sense guaranteed to complete before the node dies, but at
  9.     #   least the other cluster nodes should perform takeover.
  10.     ###########################################################################
  11.     clstop -gr -y -s -N -S
  12. ###############################################################################
  13. #   A "fast shutdown" ("-F") was specified.  We turn this into a forced down
  14. #   operation, mostly to preserve compatabilty
  15. ###############################################################################
  16. elif [[ $fast == true ]] ; then
  17.     clstop -f -y -s -N -S
  18. ###############################################################################
  19. #   A "reboot" ("-r") was specified.  Do a graceful down, without takeover,
  20. #   leaving the application cleanly down and HACMP out of the way on reboot.
  21. ###############################################################################
  22. elif [[ $reboot == true ]] ; then
  23.     clstop -g -y -s -N -S
  24. ###############################################################################
  25. #   Every other shutdown is mapped to a graceful with takeover
  26. ###############################################################################
  27. else
  28.     clstop -gr -y -s -N -S
  29. fi
  30. ###############################################################################
  31. #   this is shutdown so remove the cluster shared memory
  32. ###############################################################################
  33. sleep 4
  34. rm -f /usr/es/sbin/cluster/etc/ClSm 2>/dev/null
复制代码

论坛徽章:
0
3 [报告]
发表于 2008-09-10 03:13 |只看该作者
这种情况应当能切换,要不然HA就变成没用的东西,查一下A机与B机的HA log,以及A机的B机的errpt

论坛徽章:
0
4 [报告]
发表于 2008-09-10 15:13 |只看该作者
汗,温度有多高啊?都宕机了
查查日志吧
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP