Chinaunix

标题: 远程测试hacmp方案。[原创] [打印本页]

作者: yanbing    时间: 2003-06-21 01:25
标题: 远程测试hacmp方案。[原创]
hacmp 远程测试方法

前期准备工作:

     确认所有节点服务器上面的cluster进程均在正常运行。

     #ps -ef |grep cluster

     如果你的设备上面有至少两个cluster进程,那么证明是cluster是正常运行的。


测试内容:

A:主机主备网卡切换;

    察看/etc/hosts.明确postXXzj1_svc的地址。

    在两台机器上分别使用#ifconfig -a察看当前的ip地址,确认主机位置;

    使用#ifconfig -a确认postXXzj1_svc地址所在的网卡,为enX.

    #lscfg -vpl entX   (X为你设备上具体的en设备的号码,如ent0或ent1等)

    察看该命令的反馈,确认最后一行上面标注的物理位置码:

    P2/E1或者P2/E2指的是集成网卡;

    P2/Ix-Q1,其中大写I字母后面跟的数字就是指的是PCI插槽的号码;

    在设备PCI插槽后面标有数字。记录postXXzj1_svc对应的具体网卡位置

    在备机上可以开个窗口不断地ping这个svc地址;

     将postXXzj1_svc对应的网卡上的网线取下;

      **************此步骤也可以通过#ifconfig enX down远程完成;

     此时,窗口中间应该出现中断;在至多30秒钟内ping应该能够恢复;

     在主机上使用#ifconfig -a再次察看svc对应的具体物理网卡;

     此时物理网卡应该已经完成相应切换;

     整个过程可以使用#tail -f /tmp/hacmp.out跟踪察看;

     确认当前切换已经完成之后,可以将取下的网线接回。

     hacmp.out中间会产生jion_stby事件;并且会指明相对应的节点名称和stby地址;

     该网线接回后,原来的svc地址对应的网卡现在绑定的是1_stby地址,

     并且svc地址不会再交回原来对应的具体的物理网卡;

B:主机TAKEOVER测试;

     在主机上运行#smitty  clstop 。

     在shutdown mode选项中间选择takeover。

     完成该命令后,主机上的数据库、vg、IP地址均应还原到HACMP启动之前的初始状态;

B.a在备机上#ifconfig -a 察看IP地址是否已经变成postXXzj1_svc。(也可使用#netstat -i)

     此时如接管正常,在备机上应该存在的ip地址是postXXzj2_boot以及postXXzj1_svc;

     此时#hostname 应该是postXXzj2;

      #lsvg -o察看当前激活vg,应该包括havg;(有些地市共享vg名称为oravg);

      #mount 察看当前激活的文件系统;应该包括/disk1 ,/disk2, /disk3;

      #ps -ef|grep ora 察看相应的oracle进程是否启动;

      #ps -ef|grep mid察看相应的中间件进程是否启动;

      如上述命令反馈均正常,则证明hacmp工作正常,备机已经正常接管主机业务;

      如果出现异常情况,可以察看备机上的/tmp/hacmp.out,了解hacmp事件具体进度;

      如事件进度不明,请转至ftp hacmp.out处理方法,详情见文档(how to ftp hacmp.out)
     
      如状态正常,在主机上启动hacmp #smitty clstart;

      项目中间所有hacmp rg 均使用cascading 工作方式,主机恢复后备机应该会交回相关资源;

      如上述方法在主机上察看相应的资源状态,确认主机是否能够接管rg中间指定的资源;

      若交回过程正常,可以在5分钟后进入下面的测试。(需要5分钟时间让cluster完成脚本纪录

      及相关事宜,保证此点可以让测试不会加入其他不稳定因素)

       建议整个过程中间使用#tail -f /tmp/hacmp.out跟踪察看相应的事件进度;

C:主机关机测试;

      直接关掉主机电源(白色按键)。

       不要使用#shutdown关闭主机,这样关闭系统不会引起接管。

      转至B.a点察看备机的工作状态;如果B类测试通过正常,那么C类测试也会正常;



欢迎大家补充。谢谢!
作者: starmoon2003    时间: 2003-06-21 09:38
标题: 远程测试hacmp方案。[原创]
老大,我测过了,如果将网卡down掉,对系统有十分大的影响。


   建议还是拔网线为好。。。。。
作者: bird_man    时间: 2003-06-21 10:01
标题: 远程测试hacmp方案。[原创]
我是ES版本,用lssrc -g cluster看进程只有两个呀
作者: icewood    时间: 2003-06-21 10:37
标题: 远程测试hacmp方案。[原创]
不错,比较详细。
作者: yanbing    时间: 2003-06-21 13:34
标题: 远程测试hacmp方案。[原创]
上面的文档是这段时间远程测试14地市hacmp双机的方案,写好给客户的。
拿出来献丑了,呵呵!!

下面是cluster四个进程的各自作用,是ibm网站上的转贴:

Cluster Manager daemon(/usr/sbin/cluster/clstrmgr):是HACMP的核心进程,运行于每个群集节点,监视群集目标,如节点、网络接口、网络等的变化,生成事件,激活相应的事件脚本程序script做处理。

Cluster SMUX Peer daemon(/usr/sbin/cluster/clsmuxpd):也运行于每个群集节点,通过clinfo对客户端应用提供SNMP支持,该守护进程维护管理信息库MIB(Management Information Base)中的群集状态,可通过标准的SNMP函数访问这些数据,注意同时要运行snmpd。

Cluster Information Program daemon(/usr/sbin/cluster/clinfo):可运行于任一群集节点或RS6000客户机,通过查询SMUX Peer,来维护群集状态拓扑图,并为客户端提供应用程序接口API来访问这些数据。

Cluster Lock Manager daemon(/usr/sbin/cluster/cllockd):群集配置成共同访问的方式,需要该守护进程运行于每个群集节点,通过API为应用访问共享磁盘提供加锁功能,避免冲突。
作者: clic    时间: 2003-06-23 13:23
标题: 远程测试hacmp方案。[原创]
还要详细点就好,就可以直接给客户了.
作者: ocmocp    时间: 2003-07-04 00:18
标题: 远程测试hacmp方案。[原创]
写的真好
作者: 老农    时间: 2003-07-04 00:50
标题: 远程测试hacmp方案。[原创]
原帖由 "starmoon2003" 发表:
老大,我测过了,如果将网卡down掉,对系统有十分大的影响。


   建议还是拔网线为好。。。。。
   
实际是一样的啊,有什么问题吗?
作者: andrewqiu    时间: 2003-07-04 09:21
标题: 远程测试hacmp方案。[原创]
远程测试有实际意义吗?




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2