免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2746 | 回复: 7
打印 上一主题 下一主题

[高级应用] HA的简单问题,急!!! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-04-18 14:34 |只看该作者 |倒序浏览
哪位高手给兄弟传份HACMP的切换调试的文档, 在此先谢了。!!MAIL:poweryu1314@163.com

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
2 [报告]
发表于 2007-04-18 14:43 |只看该作者
到网上搜一下吧,很多!

论坛徽章:
0
3 [报告]
发表于 2007-04-18 15:03 |只看该作者

回复 2楼 RS9000 的帖子

大哥, 就是没找到, 所以想到这来求高手帮个忙的啊。 而且我要的那部分都写的很简单。 你能不给我传份呢, 谢谢了。 急

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
4 [报告]
发表于 2007-04-18 15:33 |只看该作者
何人何时所写,已不可考证!!!给你参考吧!!!!
-------------------------------
HACMP的测试

(一)状态检查

在开始测试 HACMP 配置之前 ,首先必须保证群集节点是在一稳定的状态 ,主要包括以下方面 :

--- 设备状态

--- 系统参数

--- 进程

--- 网络适配器

--- 群集

1 : 设备状态

. 运行 diag –a 去清除 VPD 。

. 使用命令 errpt -a |more 去检查不正常的错误 。

. 使用命令 lsattr –El ascsi0 去检查在共享总线上的适配器 scsi 地址 。

2 : 系统参数

. 使用命令 date 检查群集内所有节点的时钟是相同的 。

. 确定 licenses 的用户数是正确的 。

. 使用命令 sysdumpdev –l 和 sysdumpdev –e 去确定 dump 空间是

足够的。

. 使用命令 crontab –l 去检查定时提交的作业 。

3 : 进程状态

. 检查页空间 ( lsps –a )

. 检查不期望的进程 ( ps –ef |more )

4 : 网络状态

. 检查网卡的状态 ( ifconfig en0)

. 检查节点的网络配置 ( netstat –in )

. 检查路由 ( netstat –nr )

. 检查 ipforwarding 和 ipsendredirects 的设置 (no –a |more )

. 检查 所有接口的通信 ( ping < ip-address > )

. 检查 TCP/IP daemon 的状态 ( lssrc –g tcpip )

. 确定 /etc/hosts 文件的内容是正确的

. 如果使用了 DNS ,检查定义的 DNS 服务器是正确的 ( more

/etc/resolv.conf )

5 : 群集状态

. 检查群集进程的状态 ( lssrc –g lock 和 lssrc –g cluster )

. 运行 /usr/sbin/cluster /clstat 去检查群集和网络接口的状态

. 检查群集的 log 文件

tail –f /tmp/hacmp.out

tail –f /var/adm/cluster.log

more /tmp/cm.log

more /usr/sbin/cluster/history/cluster.mmdd

. 检查节点名是正确的 ( odmget HACMPcluster )

. 运行 /usr/sbin/cluster/diag/clconfig –v ‘-tr’ 去检查群集的配置

. 运行 /usr/sbin/cluster/utilities/cllscf 去显示群集的配置

. 去显示群集的版本 :

snmpinfo –m dump –o /usr/sbin/cluster/hacmp.defs clstrmgr

(二)故障现象模拟

为了检测 HACMP 的配置是否正确,我们可以模拟一些硬件和软件错误。假如现有一环境 : 群集中定义了两个节点 ,配置了 cascading 资源组 ,
使用 “ nodeF ”表示故障节点 ,“nodeT“表示接管节点 。

1 :适配器故障

(1)接口故障

--- 检查群集内的所有节点是运行的 。

--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。

--- 监视节点 nodeT 上的群集 log 文件 。

--- 在节点 nodeF 上 shut off 服务(service )接口 ( 如:ifconfig en0

down ),这将引起本节点的 standby 接管 service IP 地址 。

--- HACMP 转换原来的服务( service )接口为备援(standby)接口 。

--- 使用 ifconfig 命令(如:ifconfig en1 down )转换服务地址(service IP)

返回到原来的服务接口 。

(2)适配器或电缆故障

--- 检查群集内的所有节点是运行的 。

--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。

--- 监视节点 nodeT 上的群集 log 文件 。

--- 在节点 nodeF 上从服务接口(service) 断开网络电缆,这将引起本节

点的 standby 接管 service IP 地址 。

--- 检查是否接管 。

--- 重新连接网络电缆到服务(service )接口 ,将使得原来的服务接口

(service )成为备援接口(standby) 。

--- 从新的服务接口(原来的 standby)断开网络电缆 ,这将使服务接口

接管回 service IP 地址 。

--- 检查是否接管 。

--- 重新连接网络电缆到原来的备援(standby)接口 ,检查此接口是使用

standby IP 地址操作 。

2 :节点故障

(1)AIX crash

--- 检查群集内的所有节点是运行的 。

--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。

--- 在节点 nodeT 上监测群集 log 文件 。

--- 使用命令( cat /etc/hosts > /dev/kmem )去 crash 节点 nodeF ,

(在 nodeF 上 LED 将显示 888 )。

--- 在节点 nodeF 上操作系统(OS)故障将引起节点 nodeT 去接管 。

--- 检测这个接管的发生。

使用命令 ping 或 netstat –i 去检查网络 。

使用命令 lsvg –0 或 vi 去检测卷组和文件 。

使用命令 ps –ef 去检测应用进程 。

--- 重新加电节点 nodeF 且启动 HACMP ( smitty clstart ),节点nodeF

将接管回 Casscading 资源组 。

--- 检测这个节点重新加入群集后所发生的资源接管。

使用命令 ping 或 netstat –i 去检查网络 。

使用命令 lsvg –0 或 vi 去检测卷组和文件 。

使用命令 ps –ef 去检测应用进程 。

(2)cpu 损坏

--- 检查群集内的所有节点是运行的 。

--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。

--- 在节点 nodeT 上监测群集 log 文件 。

--- power off 节点 nodeF ,将引起节点 nodeT 去接管节点 nodeT的资

源 (对机器损害较大,不建议做)

--- 检测这个接管的发生。

使用命令 ping 或 netstat –i 去检查网络 。

使用命令 lsvg –0 或 vi 去检测卷组和文件 。

使用命令 ps –ef 去检测应用进程 。

--- 重新加电节点 nodeF 且启动 HACMP ( smitty clstart ),节点nodeF

将接管回 Casscading 资源组 。

--- 检测节点重新加入群集后所发生的资源接管。

使用命令 ping 或 netstat –i 去检查网络 。

使用命令 lsvg –0 或 vi 去检测卷组和文件 。

使用命令 ps –ef 去检测应用进程 。

3 :网络故障

(1) TCP/IP 子系统故障

--- 检查群集内的所有节点是运行的 。

--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。

--- 在节点 nodeT 上监测群集 log 文件 。





(2) 网络故障

--- 检查群集内的所有节点是运行的 。

--- 在节点 nodeF 上使用命令 ( errclear 0 ) 删除错误记录 。

--- 在节点 nodeT 上监测群集 log 文件 。

--- 同时断开服务(service )接口和备援(standby)接口的网络电缆 ,

将引起HACMP检测到一 network_down 事件 。

--- 检查是否发生接管 。

4 :应用故障

在缺省情况下,HACMP 不识别应用故障 ,但可以通过用户化定义,使应用故障升级为HACMP可识别的故障,所以须熟悉应用及分析应用可能的故障 。

论坛徽章:
0
5 [报告]
发表于 2007-04-18 15:45 |只看该作者

回复 4楼 RS9000 的帖子

还是好人多啊。有没有如何切换的说明呢, 谢谢了。

论坛徽章:
0
6 [报告]
发表于 2007-04-18 19:05 |只看该作者
已经写得很清楚了,慢慢看吧

论坛徽章:
0
7 [报告]
发表于 2007-04-29 17:12 |只看该作者

用smit切换啊

smit clstop
在界面上应该是最下面一个选项,选择take over
然后一路回车就切换了

论坛徽章:
0
8 [报告]
发表于 2007-04-29 17:26 |只看该作者
刚准备实施hacmp,学习了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP