免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1557 | 回复: 0
打印 上一主题 下一主题

[HACMP集群] IBM红皮书翻译之一:HACMP V5.1 for AIX (4.1) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-04-08 12:18 |只看该作者 |倒序浏览

第四章           群集校验和测试
校验和测试是成功实现群集可靠配置的基石之一。大多数系统管理员都记得他们最近一次的HACMP群集实现过程,因为那是付出将大的努力或者极大的希望才能完成的期待中的结果。
HACMP和你对它的设计、实现和测试一样,虽然HACMP是由一个强壮的结构构成的,如果没有正确的测试,那么,实现它就会是一场灾难。无计划的接管、不完善的脚本、节点无故宕机和一般停机时间都会是一个未经测试的群集的一个方面。尝试列出你能假想到的失效情况,创建一个测试计划,校验在所有情况下群集的行为,然后细心的回顾你的群集规划以确保你消除了所有的单点故障。
一些基本的测试过程将贯穿本章。谨记:高可用性不仅仅包括HACMP软件,还包括适当的硬件、可靠的软件、文档化的设计、高度定制、管理和改变管理。
4.1. 是否都可以工作?
一方面是设计、安装HACMP;另一方面是让它按你所期望的那样工作。要确认它是否能如您所愿工作只有一种方法:测试、校验、证实。谨记:群集一旦投入运行,再要进行更改就难得多。
依照你所选择的群集解决方案,测试和证实(的方法)也可能是多样化的;然而,我们在整个实现过程中的最重要的一部分——测试——上一定不能说可能足够了,更多的测试意味着更好的结果。尝试模拟所有你能想象到的事件;培植只不过能像你测试的那样工作。我们试图高亮显示所有我们发现的校验和证实配置的重点;然而,这些点只应用作一般的指导方针。
4.1.1.    硬件和许可证需求
考虑以下要点:
Ø        校验你有冗余的电源供给、风扇、控制器等等
Ø        校验你的系统板、适配器、磁盘等等的微码级别是最新的
Ø        校验使用的每个网络接口和实际交换机端口速率匹配
Ø        校验你的软件有足够的软件许可证。有些软件许可证是基于处理器ID和处理器个数的。应该保证一个节点失效,其它节点有能力接管。
4.1.2.    操作系统设置
考虑以下要点:
Ø        校验操作系统并确认操作系统或应用需求的最新PTF都已安装
Ø        校验用户数、每个用户允许执行的最大进程数、文件数上限、单个文件最大尺寸、堆栈数目等等
Ø        校验高湿度和低湿度。开始测试时,赋值为33和24。适宜的设置依赖于你的系统配置、应用需求、I/O操作总数等等。你可能还需要监视一段时间系统性能,然后对这些参数作相应的调整。
Ø        同步频率。默认值是60。你可以在监视系统性能时将它设为10,找出系统性能最优时的最小的同步频率值。
Ø        校验你有足够的换页空间
Ø        校验DUMP设备设置恰当
Ø        对于高强度的文件系统使用,可能需要一个分开的jfslog。确保它的名字和所有的逻辑卷、文件系统和其它的jfslog不同。如果你使用系统自动命名的jfslog时一定要小心。
Ø        校验文件/etc/filesystem中的每一节都被正确的定义
Ø        校验你在/,/var,和/tmp目录下有足够的磁盘空间
Ø        校验/etc/services文件
Ø        确保所有节点上的时钟设置相同(日期、时区和NTP(如果使用的话))
Ø        如果使用DNS,确保DNS服务器定义正确和当DNS变为可用时的后退计划
4.1.3.    群集环境
考虑以下要点:
Ø        校验在所有节点上PVID的一致性
Ø        校验在每个卷组上的quorum和自动varyon参数被正确的设置
Ø        确保在群集范围内所有的逻辑卷、文件系统、jfslog名称的唯一性。如果你使用系统自动命名的jfslog时一定要小心。
Ø        校验所有的文件系统都已经加载(mount)
Ø        校验应用程序所有者用户ID和组ID在所有节点上相同
Ø        确保应用使用的变量和用户配置文件在群集节点间的一致性
Ø        校验crontab和你是否有关联到资源组或应用和需要通过它进行切换的脚本。
Ø        校验你的应用只通过HACMP启动。回顾/etc/inittab文件对此有帮助。
Ø        测试你的应用启动/停止和监视脚本(对自定义监视)并确保它们可以在无人值守的情况下运行和提供有用的日志记录。
Ø        对每个资源执行手动接管并记录下CPU和磁盘使用率的相关信息。接管时间等等。这些信息可以在将来定制应用监视和资源组行为时使用。





本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/6482/showart_96861.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP