论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2006-04-12 17:36 |只看该作者 |倒序浏览

4.5. 应用程序监视
启动群集服务之后，确保你的应用程序启动并运行、该应用的所有服务均可用并且用户可以连接。
校验所有的应用进程启动并运行并且他所需求的资源（卷组、文件系统、逻辑卷和IP地址）均可用。
强烈建议您测试您为每个应用定义的启动、停止脚本。这些脚本在不同的节点上可能需要作一定的改变。启动脚本应该允许应用从先前的一异常终止中恢复，这一点要细心写脚本。停止脚本必须允许应用正确停止、保持数据同步并释放所有资源。
4.5.1. 校验应用程序状态
你可以使用应用监视进程或者自定义应用监视来监视你的应用程序。
应用监视进程
这种类型的监视使用RSCT特性，在应用进程级别工作，很容易被配置。对监视的配置很大程度上依赖于你的应用程序的特性。我们建议以下指导方针：
Ø       确保你定义了一个应用服务器
Ø       确保你使用命令ps -ef的输出来指定被监视的进程名称。
Ø       确保你给进程指定了正确的所有者
Ø       确保你指定了正确的要求数字
Ø       你应该选择一个稳定的时间间隔以保证应用有足够的时间从上一次异常关闭中恢复。
Ø       确保你正确设置了重启计时器。你可能不想在从不在该节点启动的节点上重启应用；而是希望初始化切换过程。
Ø       确保你设置了正确的重启间隔。如果该值很小，重启计时器会被复位同时切换和通告动作不会在他们该发生的时候发生。
Ø       如果你需要对应用失效作特殊的评估，将它们包含在清除方法的脚本中。
自定义应用监视
如果要监视有关应用的所有参数，你不得不自己写脚本。无论何时你不能使用应用监视时都可以使用这种方法。如果应用正常工作的话确保你的脚本返回退出码为0。
4.5.2. 校验资源组状态
当监视集群时，你可能对查看资源组和拓扑状态比较感兴趣。找到的资源组可以处于下列状态：在线、离线、获取中、释放中、错误、临时错误或者未知。
你可以使用命令/usr/es/sbin/cluster/utilities/clfindres或者来找出资源组的状态，它们的结果是一样的，因为/usr/es/sbin/cluster/utilities/clfindres调用clRGinfo。
这个命令常用的标志有：
-t          使用这个标志显示自定义资源组的沉淀时间和延迟后退时间设置。
-p          使用这个标志显示资源组的优先覆盖位置。
带-p标志的命令输出如Example 4-10所示：
你总是可以使用命令/usr/es/sbin/cluster/utilities/cltopinfo来查看群集拓扑，如Exampl 4-11所示：

4.5.3. 校验NFS功能
注意：开始使用NFS之前，你必须明白恢复特性和锁定恢复功能（在NFS服务器失效时）只在两节点群集中可用。
你必须明白：在HACMP群集中使用NFS有一些限制。如果你使用通过别名的IPAT或者通过替换的IPAT，NFS行为是不同的。请注意你的文件系统属于哪种类型的资源组（层叠式、轮换式或者自定义）、可用服务的数目、引导接口和路由表中的路由。
你可以选择两种不同类型的NFS加载方式：硬和软。
Ø       如果你试图在导出服务器不可用时软mount文件系统，你会收到一个错误。
Ø       如果你试图在导出服务器不可用时硬mount文件系统，它会一直尝试直到导出服务器可用。它可能对您的应用不太适合。
注意：硬mount是默认选择。
确保每个节点的主机名称和服务标签匹配是一个好的普通的惯例，因为一些应用使用主机名。
在我们测试NFS的例子中，我们使用一个两节点群集，共有两个层叠式资源组，两个文件系统通过服务地址被导出。
使用以下步骤测试NFS的功能：
1.       定义两个卷组，vg01和vg02。确保在两个节点上每个卷组的主设备号（major number）都一样。
2.       在每个卷组中定义LV和将来被导出时使用的文件系统，将它们命名为/ap1_fs和/ap2_fs。确保LV名称和jfslog名称在两个节点上的一致性。
3.       你也可以使用C-SPOC执行上一步的任务（无需担心VG主设备号、LV名称或jfslog名称在群集范围内的唯一性）。
4.       定义两个名为rq01和rq02的层叠式资源组。
5.       对rg01，定义节点1和节点2为参与节点
6.       对rg02，定义节点2和节点1为参与节点
7.       创建两个用来加载文件系统的目录：/mount_point1和/mount_point2。
8.       运行smitty hacmp,进入层叠式资源组的Change/Show All Resources and Attributes面板
9.       对rg01指定：
Ø       Filesystems 项填/app1_fs
Ø       Filesystem mounted before IP Configured field项填true
Ø       Filesystems/Directories to Export项填/app1_fs
Ø       Filesystems/Directories to NFS mount项填/mount_point1；/app1_fs
10. 对rg02指定：
Ø       Filesystems 项填/app2_fs
Ø       Filesystem mounted before IP Configured field项填true
Ø       Filesystems/Directories to Export项填/app2_fs
Ø       Filesystems/Directories to NFS mount项填/mount_point2；/app2_fs
11. 如果你规划了NFS导出的指定选项，你必须编辑/usr/es/sbin/cluster/etc/exports文件，它的格式和AIX下/etc/exports文件一样。
12. 同步群集资源
13. 在两个节点上启动群集服务
14. 分别使用命令lssrc -g cluster和lssrc -g nfs校验群集和NFS服务是否成功启动
15. 校验节点1 varyon了vg01。/filesystem1应被本地mount，/filesystem2应被NFS mount。使用命令showmount -e校验节点1已经将/filesystem1作为NFS导出。
16. 校验节点2 varyon了vg02。/filesystem2应被本地mount，/filesystem1应被NFS mount。使用命令showmount -e校验节点2已经将/filesystem2作为NFS导出。
17. 使用接管选项在节点1上停止群集服务
18. 校验节点2 varyon了vg01。/filesystem1和/filesystem2被同时本地mount和NFS mount。它们被作为NFS正常导出。
19. 重新启动节点1的群集服务。/filesystem1应该再一次被本地和NFS同时mount。
4.6. 节点失效时的群集行为
在节点通过断电或者运行命令cp /dev/zero /dev/kmem或halt -q来模拟节点崩溃。
校验属于失效节点的资源组应该被迁移，群集仍然向它的客户端提供服务。

本文来自ChinaUnix博客，如果查看原文请点：http://blog.chinaunix.net/u/6482/showart_98864.html

文库|博客

返回列表

Chinaunix › 论坛 › 操作系统 › AIX › AIX文档中心 › IBM红皮书翻译之一：HACMP V5.1 for AIX （4.5-4.6）

[HACMP集群] IBM红皮书翻译之一：HACMP V5.1 for AIX （4.5-4.6） [复制链接]

浏览过的版块