免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4068 | 回复: 7
打印 上一主题 下一主题

HA的简单问题,急!!! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-04-18 14:34 |只看该作者 |倒序浏览
哪位高手给兄弟传份HACMP的切换调试的文档, 在此先谢了。!!MAIL:poweryu1314@163.com

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
2 [报告]
发表于 2007-04-18 14:43 |只看该作者
到网上搜一下吧,很多!

论坛徽章:
0
3 [报告]
发表于 2007-04-18 15:03 |只看该作者

回复 2楼 RS9000 的帖子

大哥, 就是没找到, 所以想到这来求高手帮个忙的啊。 而且我要的那部分都写的很简单。 你能不给我传份呢, 谢谢了。 急

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
4 [报告]
发表于 2007-04-18 15:33 |只看该作者
何人何时所写,已不可考证!!!给你参考吧!!!!\r\n-------------------------------\r\nHACMP的测试 \r\n\r\n(一)状态检查 \r\n\r\n在开始测试 HACMP 配置之前 ,首先必须保证群集节点是在一稳定的状态 ,主要包括以下方面 : \r\n\r\n--- 设备状态 \r\n\r\n--- 系统参数 \r\n\r\n--- 进程 \r\n\r\n--- 网络适配器 \r\n\r\n--- 群集 \r\n\r\n1 : 设备状态 \r\n\r\n. 运行 diag –a 去清除 VPD 。 \r\n\r\n. 使用命令 errpt -a |more 去检查不正常的错误 。 \r\n\r\n. 使用命令 lsattr –El ascsi0 去检查在共享总线上的适配器 scsi 地址 。 \r\n\r\n2 : 系统参数 \r\n\r\n. 使用命令 date 检查群集内所有节点的时钟是相同的 。 \r\n\r\n. 确定 licenses 的用户数是正确的 。 \r\n\r\n. 使用命令 sysdumpdev –l 和 sysdumpdev –e 去确定 dump 空间是 \r\n\r\n足够的。 \r\n\r\n. 使用命令 crontab –l 去检查定时提交的作业 。 \r\n\r\n3 : 进程状态 \r\n\r\n. 检查页空间 ( lsps –a ) \r\n\r\n. 检查不期望的进程 ( ps –ef |more ) \r\n\r\n4 : 网络状态 \r\n\r\n. 检查网卡的状态 ( ifconfig en0) \r\n\r\n. 检查节点的网络配置 ( netstat –in ) \r\n\r\n. 检查路由 ( netstat –nr ) \r\n\r\n. 检查 ipforwarding 和 ipsendredirects 的设置 (no –a |more ) \r\n\r\n. 检查 所有接口的通信 ( ping < ip-address > ) \r\n\r\n. 检查 TCP/IP daemon 的状态 ( lssrc –g tcpip ) \r\n\r\n. 确定 /etc/hosts 文件的内容是正确的 \r\n\r\n. 如果使用了 DNS ,检查定义的 DNS 服务器是正确的 ( more \r\n\r\n/etc/resolv.conf ) \r\n\r\n5 : 群集状态 \r\n\r\n. 检查群集进程的状态 ( lssrc –g lock 和 lssrc –g cluster ) \r\n\r\n. 运行 /usr/sbin/cluster /clstat 去检查群集和网络接口的状态 \r\n\r\n. 检查群集的 log 文件 \r\n\r\ntail –f /tmp/hacmp.out \r\n\r\ntail –f /var/adm/cluster.log \r\n\r\nmore /tmp/cm.log \r\n\r\nmore /usr/sbin/cluster/history/cluster.mmdd \r\n\r\n. 检查节点名是正确的 ( odmget HACMPcluster ) \r\n\r\n. 运行 /usr/sbin/cluster/diag/clconfig –v ‘-tr’ 去检查群集的配置 \r\n\r\n. 运行 /usr/sbin/cluster/utilities/cllscf 去显示群集的配置 \r\n\r\n. 去显示群集的版本 : \r\n\r\nsnmpinfo –m dump –o /usr/sbin/cluster/hacmp.defs clstrmgr \r\n\r\n(二)故障现象模拟 \r\n\r\n为了检测 HACMP 的配置是否正确,我们可以模拟一些硬件和软件错误。假如现有一环境 : 群集中定义了两个节点 ,配置了 cascading 资源组 ,\r\n使用 “ nodeF ”表示故障节点 ,“nodeT“表示接管节点 。 \r\n\r\n1 :适配器故障 \r\n\r\n(1)接口故障 \r\n\r\n--- 检查群集内的所有节点是运行的 。 \r\n\r\n--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。 \r\n\r\n--- 监视节点 nodeT 上的群集 log 文件 。 \r\n\r\n--- 在节点 nodeF 上 shut off 服务(service )接口 ( 如:ifconfig en0 \r\n\r\ndown ),这将引起本节点的 standby 接管 service IP 地址 。 \r\n\r\n--- HACMP 转换原来的服务( service )接口为备援(standby)接口 。 \r\n\r\n--- 使用 ifconfig 命令(如:ifconfig en1 down )转换服务地址(service IP) \r\n\r\n返回到原来的服务接口 。 \r\n\r\n(2)适配器或电缆故障 \r\n\r\n--- 检查群集内的所有节点是运行的 。 \r\n\r\n--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。 \r\n\r\n--- 监视节点 nodeT 上的群集 log 文件 。 \r\n\r\n--- 在节点 nodeF 上从服务接口(service) 断开网络电缆,这将引起本节 \r\n\r\n点的 standby 接管 service IP 地址 。 \r\n\r\n--- 检查是否接管 。 \r\n\r\n--- 重新连接网络电缆到服务(service )接口 ,将使得原来的服务接口 \r\n\r\n(service )成为备援接口(standby) 。 \r\n\r\n--- 从新的服务接口(原来的 standby)断开网络电缆 ,这将使服务接口 \r\n\r\n接管回 service IP 地址 。 \r\n\r\n--- 检查是否接管 。 \r\n\r\n--- 重新连接网络电缆到原来的备援(standby)接口 ,检查此接口是使用 \r\n\r\nstandby IP 地址操作 。 \r\n\r\n2 :节点故障 \r\n\r\n(1)AIX crash \r\n\r\n--- 检查群集内的所有节点是运行的 。 \r\n\r\n--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。 \r\n\r\n--- 在节点 nodeT 上监测群集 log 文件 。 \r\n\r\n--- 使用命令( cat /etc/hosts > /dev/kmem )去 crash 节点 nodeF , \r\n\r\n(在 nodeF 上 LED 将显示 888 )。 \r\n\r\n--- 在节点 nodeF 上操作系统(OS)故障将引起节点 nodeT 去接管 。 \r\n\r\n--- 检测这个接管的发生。 \r\n\r\n使用命令 ping 或 netstat –i 去检查网络 。 \r\n\r\n使用命令 lsvg –0 或 vi 去检测卷组和文件 。 \r\n\r\n使用命令 ps –ef 去检测应用进程 。 \r\n\r\n--- 重新加电节点 nodeF 且启动 HACMP ( smitty clstart ),节点nodeF \r\n\r\n将接管回 Casscading 资源组 。 \r\n\r\n--- 检测这个节点重新加入群集后所发生的资源接管。 \r\n\r\n使用命令 ping 或 netstat –i 去检查网络 。 \r\n\r\n使用命令 lsvg –0 或 vi 去检测卷组和文件 。 \r\n\r\n使用命令 ps –ef 去检测应用进程 。 \r\n\r\n(2)cpu 损坏 \r\n\r\n--- 检查群集内的所有节点是运行的 。 \r\n\r\n--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。 \r\n\r\n--- 在节点 nodeT 上监测群集 log 文件 。 \r\n\r\n--- power off 节点 nodeF ,将引起节点 nodeT 去接管节点 nodeT的资 \r\n\r\n源 (对机器损害较大,不建议做) \r\n\r\n--- 检测这个接管的发生。 \r\n\r\n使用命令 ping 或 netstat –i 去检查网络 。 \r\n\r\n使用命令 lsvg –0 或 vi 去检测卷组和文件 。 \r\n\r\n使用命令 ps –ef 去检测应用进程 。 \r\n\r\n--- 重新加电节点 nodeF 且启动 HACMP ( smitty clstart ),节点nodeF \r\n\r\n将接管回 Casscading 资源组 。 \r\n\r\n--- 检测节点重新加入群集后所发生的资源接管。 \r\n\r\n使用命令 ping 或 netstat –i 去检查网络 。 \r\n\r\n使用命令 lsvg –0 或 vi 去检测卷组和文件 。 \r\n\r\n使用命令 ps –ef 去检测应用进程 。 \r\n\r\n3 :网络故障 \r\n\r\n(1) TCP/IP 子系统故障 \r\n\r\n--- 检查群集内的所有节点是运行的 。 \r\n\r\n--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。 \r\n\r\n--- 在节点 nodeT 上监测群集 log 文件 。 \r\n\r\n\r\n\r\n\r\n\r\n(2) 网络故障 \r\n\r\n--- 检查群集内的所有节点是运行的 。 \r\n\r\n--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。 \r\n\r\n--- 在节点 nodeT 上监测群集 log 文件 。 \r\n\r\n--- 同时断开服务(service )接口和备援(standby)接口的网络电缆 , \r\n\r\n将引起HACMP检测到一 network_down 事件 。 \r\n\r\n--- 检查是否发生接管 。 \r\n\r\n4 :应用故障 \r\n\r\n在缺省情况下,HACMP 不识别应用故障 ,但可以通过用户化定义,使应用故障升级为HACMP可识别的故障,所以须熟悉应用及分析应用可能的故障 。

论坛徽章:
0
5 [报告]
发表于 2007-04-18 15:45 |只看该作者

回复 4楼 RS9000 的帖子

还是好人多啊。有没有如何切换的说明呢, 谢谢了。

论坛徽章:
0
6 [报告]
发表于 2007-04-18 19:05 |只看该作者
已经写得很清楚了,慢慢看吧

论坛徽章:
0
7 [报告]
发表于 2007-04-29 17:12 |只看该作者

用smit切换啊

smit clstop\r\n在界面上应该是最下面一个选项,选择take over\r\n然后一路回车就切换了

论坛徽章:
0
8 [报告]
发表于 2007-04-29 17:26 |只看该作者
刚准备实施hacmp,学习了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP