免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1894 | 回复: 0
打印 上一主题 下一主题

[HACMP集群] IBM红皮书翻译之一:HACMP V5.1 for AIX (3) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-04-02 10:37 |只看该作者 |倒序浏览

第三章           安装与配置
在这一章我们将介绍一些基本HACMP的安装和各种不同的安装过程。本章中覆盖以下主题:
Ø        HACMP软件安装
Ø        网络配置
Ø        存储配置
Ø        HACMP群集配置
-          拓扑配置
-          资源配置(标准的)
-          自定义资源配置
注意:规划是实现成功的一半,但在开始实施时,不能再强调需要适当的计划。如果没有进行正确的规划,你会在最后深陷泥潭,要找出解决方法是令人痛苦的一件事情。因此,在使用HACMP规划工作表时多花些时间,对于在解决问题、迁移、或文档编制都是很有价值的。
3.1. HACMP软件安装
HACMP提供了一系列有用的功能,你可以用它们来使您的应用高可用。牢记:并非所有的系统或应用组件都能被HACMP保护。例如:重要应用的所有数据存储在单一的一块磁盘上,而该磁盘失效,那么这个磁盘就是整个群集的SPOF,并且它不被HACMP所保护,在这种情况下,应该使用AIX的逻辑卷管理器或者存储子系统来保护数据。HACMP只提供在备机上对该磁盘的接管以确保数据的可用性。这就是为什么规划重要的原因:因为你的主要目标是消除SPOF。存在SPOF的群集相当于处于临界状态,如果该SPOF设备失效,群集不在起作用以来该组件的应用或服务将不再可用。
同样谨记:规划良好的群集是易于安装的、提供更高的可用性、按预期目标执行并且只需要较少的维护工作。
3.1.1.    检查需求
完成规划工作表之后,首先检查系统是否满足HACMP的需求,在这里特别的努力可以消除一些系统潜在的错误。
HACMP V5.1需要以下操作系统组件:
Ø        AIX 5L V5.1 ML5和RSCT V2.2.1.30或更高
Ø        AIX 5L V5.2 ML2和RSCT V2.3.1.0或更高(推荐2.3.1.1)
Ø        C-SPOC vpath支持的话需要SDD 1.3.1.3或者更高
3.1.2.    新安装
在HACMP交替磁盘迁移选项中支持网络安装管理(NIM)程序。你必须在每个节点上安装HACMP文件集(通过NIM或本地软件库)。
通过NIM服务器安装
推荐使用NIM的原因仅仅是因为HACMP软件在NIM服务器上加载的速度比在其他节点上通过其他媒体加载更快。此外,它是一个灵活的软件分发途径,它允许你在多个节点上并行安装软件或者更新维护,在一个大型环境中这是横有用的,在小型环境中本地软件库(安装、维护)就足够了。
如果选择NIM,在执行安装之前必须将所有HACMP文件集拷贝到NIM服务器上并定义一个LPP资源。
通过CD-ROM或硬盘安装
如果环境中节点较少或者不需要使用NIM,可以采用CD-ROM安装或者创建一个本地安装源(通过将文件集拷贝到磁盘并使用exportfs命令以便其他节点访问该安装源)。
其他安装方法,例如在SP系统上安装和如何创建安装服务器请参考SC23-4389(AIX 5L V5.2安装指南和参考第三章:网络安装)
3.1.3.    安装HACMP
安装以前确保已经阅读了在/usr/es/lpp/cluster/doc目录下的HACMP V5.1发行指南以了解更新信息和已知问题。
在一个服务器节点上安装HACMP软件的步骤如下:
1.             如果使用安装媒体直接安装(CD-ROM或磁盘),请使用smitty install_all快速路径;
2.             输入安装媒体的设备名称(/dev/cdrom)或者安装目录名称并回车;
3.             输入相应的字段的值:选择安装软件时可以通过F4选择,也可以输入all以安装所有;有些软件安装的要求您的系统可能不满足(例如:Tivoli监视器)。Cluster.es和cluster.cspoc(包含HACMP实时运行)必须安装在所有服务器上。
注意:如果你安装并发资源管理特性,就必须安装cluster.es.clvm软件包;若过你选择Cluster.es和cluster.cspoc,其他关联信息包也应安装。
确保在接受用户许可项上选择“yes”,每个节点上仅需接受一次。
4.             按回车键执行安装进程。
补充安装步骤:
要在HACMP软件安装后进行完全安装,执行以下步骤:
1.              通过lppchk命令核实安装软件,检查安装目录下移提供了需要安装的文件。
2.              运行lppchk –v和lppchk –c cluster命令,如果它们的结果都干净,说明安装是好的;否则就需要修补相关问题。
3.              推荐重启群集环境中的每个节点(非强制性)。如果你不想重启节点,确保通过以下命令在所有群集节点上开启群集通讯后台进程(clcomdES):
# startsrc –s clcomdES
3.1.4.    迁移路线和选项
如果执行更新或转换群集,就有以下选项:节点到节点迁移和快照转换。
节点到节点迁移
节点到节点迁移用在迁移过程中保持应用的可用性,步骤如下:
1.在每个节点上停止集群服务。
2.更新HACMP软件。
3.重建集群节点。
这个过程可以参考轮转迁移,这个迁移选项的一些限制请参考:3.1.6 节点到节点的迁移。
如果你可以为应用提供一个维护窗口,迁移步骤如下:
1.在每个节点上停止集群服务。
2.在每个节点上更新HACMP软件。
3.在每个节点上重启集群服务。
快照迁移
同样可以使用快照迁移特性转换整个集群。在这个过程中集群不再可用,在集群可以重新活动以前,所有的节点必须被更新。
3.1.5.    通过快照再生群集
这个迁移方法用于AIX和HACMP同时需要更新的场合。
重要的:不要将群集长时间置于混合环境下,因为此时群集没有保证。
再生HACMP支持版本的HAS步骤如下:
1.确保软件处于committed状态(而不是applied状态)。
2.保存HAS集群配置和你需要保留的时间脚本到快照。
3.在所有节点上卸载HAS软件。
4.安装HACMP V5.1。
5.校验已安装的软件。
6.再生并应用已保存的快照。
集群快照功能允许你通过如下步骤将集群配置保存到文件中:
1.如果需要的话,重新安装保存的自定义时间脚本。
2.重启每个节点
3.同步并校验HACMP V5.1的配置。
下面解释这些步骤。
检查先前的HACMP版本
要看你的系统中是否安装了HACMP典型(HAS)软件,输入命令:
# lslpp –h “cluster*”
如果lslpp的结果显示HACMP已经安装但是它的版本低于V4.5,在使用快照功能前先将其升级至最低V4.5。更多信息请参考SC23-4862-02:AIX V5.1下HACMP管理与配错。
保存集群配置和自定义事件脚本
通过创建HACMP快照保存HACMP集群配置,如果有自定义的时间脚本,它们也必须被保存。
注意:不要将集群配置和自定义事件脚本保存到如下目录:/usr/sbin/cluster,/usr/es/sbin/cluster,/usr/lpp/cluster。这些目录会在安装新HACMP软件包时被删除并重建。
怎样卸载HACMP(HAS)软件
1.进入smitty install_remove快速路径。如下Example 3-1:


安装HACMP V5.1
参考3.1.3 安装HACMP软件中的步骤进行。
注意:没有再生和应用快照以前不要重启。
校验软件安装
在集群节点上安装完HACMP软件后就需要再生和应用先前版本下保存的快照。
再次提醒:重启节点以前必须执行再生快照。
再生和应用快照的步骤如下:
1.使用clconvert_snapshot工具,指定要再生到的新的HACMP(HAS)的版本。-C参数再生一个HACMP快照为HACMP V5.1快照格式:
2.clconvert_snapshot –C –v version –s
3.应用快照。
重新安装保存的自定义事件脚本
注意:某些先前版本中的前期、后期事件脚本在HACMP V5.1中不可用,特别是在使用并发资源组的时候。
重新启动群集节点
重新启动群集节点是激活新的群集通讯后台进程(clcomdES)所必须的。
校验、同步集群配置
校验可以提供错误和/或警告以确保在所有节点上集群定义是相同的,下面介绍群集校验过程。
运行smitty hacmp,选择 Extended Configuration—〉Extended Verification and Synchronization,选择Verify changes only,然后回车。如Example 3-2。


重要的:不能在混合版本集群中同步配置,也不要让群集长时间处于混合版本中。V5.1支持的新功能只有当所有节点被更新、群集同步以后才能可用。
3.1.6.    节点到节点的迁移
执行节点到节点(轮转)迁移时必须考虑以下问题:
Ø        群集中所有节点都必须安装HACMP V4.5并且处于committed。
Ø        节点到节点迁移功能只适用于HACMP(HAS)V4.5到V5.1的迁移。
Ø        群集中所有节点必须运行HAS V4.5软件。
Ø        群集处于稳定状态。
Ø        具有保证HAS和HACMP软件迁移进程有足够的磁盘空间:
-          /usr目录大约120MB
-          /目录大约1.2MB
Ø        当迁移完成后,对磁盘空间的需求降至独立HACMP V5.1的要求量。
Ø        节点必须有足够的内存来同时运行HAS和HACMP后台进程。最少要求64MB,推荐值为128MB。
Ø        检验你应没有群集不支持的网络。迁移开始后你不能对群集进行改变,因此应移去不支持的网络或改变它。
重要的:和其他群集一样,在迁移进程开始后不要尝试对群集拓扑和资源作任何改变。
Ø        如果群集中的节点设为重启后自动运行群集服务,请在迁移开始前改变它,改变步骤如下:
-          使用C-SPOC来关闭系统重启时群集自动启动
-          使用SMIT快速路径smitty clstop,参见Example 3-3。

如果你没有使用C-SPOC,那就必须在每个节点上分别改变它。
怎样执行节点到节点迁移
1.               保存系统配置的快照到安全的目录(安装过程不访问的),不要使用/usr/sbin/cluster。
2.               在运行HASV4.5的节点上使用合适的接管方法停止群集服务。命令如下:
# /usr/es/sbin/cluster/utilities/clstop –gr
3.               先校验集群节点上的集群服务已经停止且集群资源已经被接管至另一个节点。
4.               在节点上安装HACMP V5.1
5.               使用AIX命令lppchk检查已安装的软件
6.               重启节点
7.               重启HACMP软件
a.         进入快速路径smitty hacmp.
b.        进入系统管理System Management(C-SPOC).
c.         选择管理HACMP服务Manage HACMP Services.
d.        选择启动群集服务Start Cluster Services.
当你重启群集服务时:
-          HACMP软件也会启动。
-          该节点的HACMP群集服务和该节点会重新加入群集。
-          该节点会重新获取它作为主节点的层叠资源(依赖于非活动接管设置)。
HACMP新旧版本都运行在节点上,但是只有HACMP Classic(HAS)控制群集时间和资源。如果你用系统资源管理器里出这些后台进程,你会在这个混合节点上看到下列后台进程:
HACMP                       HACMP/ES                        RSCT
Clstmgr                       clstmgrES                         grpsvcs
clockd (optional)       clockdES (optional)        topsvcs
clsmuxpd                    clsmuxpES                       emsvcs
clinfo (optional)         clinfoES (optional)                    grpglsm
clcomdES                        emaixos
8.               在群集的其他节点上重复2到6步。
注意:在最后一个节点重启群集服务后将无法返回。一旦你重启了HACMP(新旧版本),迁移就开始了,你不能后退迁移。如果你希望在此时返回HACMP配置(后退迁移),你必须重装HACMP并应用保存的快照。此后,你可以收回HACMP的安装并返回你运行的HACMP集群。如果你要这么做,请参考下面的“收回过程”。
在安装和迁移过程中,当你重启节点时,节点同时运行两个产品:HACMP clstrmgr控制群集事件,clstrmgrES处于被动模式。
当最后一个节点的群集服务启动后,HACMP迁移自动进行。群集控制自动传输给HACMP V5.1后台进程。
文档化的迁移处理被记录在/tmp/hacmp.out文件和/tmp/cm.log和/tmp/clstrmgr.debug文件中。
9.               所有节点更新和重启以后,群集处于可用状态。同步和校验配置请参考3.5.8:校验、同步HACMP
你也可以在迁移完成后校验群集的切换和恢复行为。
注意:从HAS 4.51到HACMP V5.1的节点到节点迁移过程中你会看到如下警告信息:
sysck: 3001-036 WARNING: File /etc/cluster/lunreset.lst is also owned by
fileset cluster.base.server.events.
sysck: 3001-036 WARNING: File /etc/cluster/disktype.lst is also owned by
fileset cluster.base.server.events.
你可以安全的忽略这些信息并执行安装过程。
配置太长(config_too_long)消息
当迁移过程完成后,属于安装的HACMP文件集中你会看到一个config_too_long消息。这个消息出现在群集管理器检测到超出指定时间的群集事件处理时。该消息会附加在hacmp.out文件后面直到事件完成。如果你查看这些消息,你会发现事件一直在运行,并没有失效。
你可以通过SMIT菜单调出config_too_long事件以避免在HACMP前调出它而增加等待时间。要改变事件处理的时间间隔,执行以下步骤:
1.        进入快速路径smitty hacmp.
2.        进入Extended Configuration.
3.        选择Extended Event Configuration.
4.        选择Change/Show Time Until Warning.
你必须在每个节点上这么做,改变在群集服务重启后生效。
节点到节点的迁移是如何工作的
当你在所有节点上安装了HACMP V5.1后(节点都处于混合模式),在最后一个节点启动群集服务后引起自动控制传输至HACMP V5.1,如下:
1.            在安装HACMP V5.1的安装目录中安装了一个名为firstboot的恢复文件,和一个用作迁移过程标志的迁移文件(.mig文件)。
2.            HACMP恢复进程向群集管理器发送一个运行等待事件和等待完成事件的消息。
HACMP使用RSCT组服务来校验群集的可用状态和成员资格。
-          每个群集节点上的firstboot文件被移动到活动目录(/etc)下。
-          迁移标志文件(.mig)创建在所有节点的安装过程中从HACMP V5.1目录到HACMP V4.5目录的传输。
当所有节点的firstboot文件被移到活动目录/etc下,.mgr文件传送完成时,仍然由HACMP迁移事件控制HACMP的传输。
3.            HACMP恢复驱动对迁移事件的影响。
-          HACMP V5.1使用force选项停止HACMP V4.5的后台进程。
-          HACMP V4.5的clinfoES和clsmuxpdES进程都被激活,它们继续使用HACMP V4.5中使用的端口号。
4.            HACMP恢复驱动运行迁移完成事件。
-          HACMP的反安装,除公用的配置文件外都不再触及。
-          基本目录被重新链接
-          /etc/first文件被删除
-          HACMP /usr/sbin/cluster目录下的.mgr文件被删除
5.            迁移完成。
在迁移过程中保存的快照
先前保存的快照被保存在/usr/es/sbin/cluster/snapshots目录下。
在迁移过程中处理节点失效
迁移过程中,如果在节点文件firstboot移动到/etc目录后发生节点失效,节点重启时会完成迁移过程,然而,当失效节点加入群集后,它会有个没被同步的的HACMP ODM,要在重新加入群集前进行群集拓扑和资源的同步。具体步骤参考3.5.8 “校验、同步HACMP”。
后退过程
如果因为一些原因你不想完成迁移,你可以在启动最后一台节点的HACMP服务之前的任意一步卸载节点上的HACMP V5.1软件。
注意:卸载HACMP软件只能在本地进行。在迁移过程中,不要选择在多个节点上卸载软件。
卸载HACMP步骤如下:
1.            在一个又一个节点上停止HACMP服务(步骤参考Example 3-3):检查节点上的HACMP服务已经停止其人相关联的资源已经被接管。
2.            确认资源已经被正确接管后开始卸载HACMP。
3.            启动节点的HACMP服务,确定资源被该节点正确接管后在其他节点上那个重复这些步骤。
4.            继续这些步骤直到HACMP在所有节点上都已经被卸载。
在节点到节点迁移过程中处理同步失效
如果你尝试在迁移未完成时对群集拓扑或资源作改变,同步就会失效。你会受到如下错误信息:
cldare: Migration from HACMP V4.5 to HACMP V5.1 Detected. cldare cannot be run until migration has completed.
要收回刚才的改变,你必须恢复活动的ODM,执行以下步骤:
1.            进入smitty hacmp
2.            进入Problem Determination Tools.
3.            选择Restore HACMP Configuration Database from Active Configuration.
3.1.7.    更新选项
这里我们讨论HACMP的更新。
HACMP V5.1支持的更新(途径):
Ø        从HACMP/ES V4.4.1到HACMP V5.1
Ø        从HACMP/ES V4.5到HACMP V5.1
如果你想从更早版本的HACMP更新到V5.1,你必须先将其更新到这儿列出的支持的版本,然后才能更新到V5.1。
更新到HACMP V5.1的步骤如下:
1.            更新AIX 5L V5.1的维护级别为5或者更高(如果需要的话)
2.            必要的话,检查并校验AIX的安装
3.            在所有节点上commit当前HACMP软件
4.            使用命令clstop停止一个能被评为接管的节点
5.            资源接管成功后开始安装新的HACMP软件(步骤参考3.1 HACMP软件安装)。使用lppchk命令校验软件安装并检查安装目录中期望的文件都已提供。如果安装OK的话命令lppchk –v和lppchk –c “cluster.*”都应该干净运行。
6.            重启第一个节点。
7.            使用smitty clstart启动第一个节点的HACMP服务并校验其是否成功加入群集。
8.            在其他剩余节点依次执行上述步骤
9.            检查tty设备是否被配置成为了串行网络
10.        检查第一个节点上所有外部磁盘都可用(使用lspv检查每个磁盘的PVID)。如果磁盘的PVID没有显示,你可能需要删除并重新配置它们。
11.        所有节点更新完成后,从第一个节点到其他所有节点同步群集拓扑,不要在同步时跳过校验步骤。
重要的:当节点没有更新完成前处于混合状态,不要在此时从该节点同步集群定义。因为cl_convert工具给群集中所有节点分发节点ID时,新ID可能会与现有ID冲突。
12.        恢复HACMP事件的ODM对象类以存储及群众配置的pre-和post-事件。
13.        必要的话对集群作一些附加的改变。
14.        在集群应用到生产中以前完成一个测试阶段。
校验更新的集群定义
参考3.5.8 校验、同步HACMP。
cl_convert和clconvert_snapshot
更新HACMP /ES软件到新版本包括ODM库到新版本的迁移。当你安装HACMP软件时,cl_convert会自动运行。然而,如果安装失败,就要在命令行手动运行cl_convert。在一个失败的转化中,必须使用带-F参数的cl_convert命令。例如:
# /usr/es/sbin/cluster/conversion/cl_convert –F –v 4.5.0
运行转换工具要求:
根用户权限
指定要转换的HACMP版本
cl_convert工具记录转换过程到/tmp/clconvert.log文件,你可以通过该文件知道转换是否成功。每次执行cl_convert或者clconvert_snapshot这个日志文件都会被重写。
clcovert_snapshot工具不能在安装时自动运行,它只能在命令行执行。当迁移HACMP时运行clconvert_snapshot命令可以更新集群快照。
更新并发资源管理器
在节点上安装并发访问特性和并发资源管理器使用过程参考3.1 HACMP软件安装。
如果你安装了HACMP的并发资源管理特性,AIX 5L V5.1支持增强并发模式(ECM)。
安装中的问题
如果在安装过程中出现了问题,安装程序自动执行一个清除处理。如果因为某些原因,在安装出错后清除程序没有进行,执行以下步骤:
1.            进入smitty install
2.            选择Software Maintenance and Utilities.
3.            选择Clean Up After a Interrupted Installation.
4.            查看SMIT的输出(或者/smit.log文件),确定中断原因
5.            使用AIX问题处理技巧修复问题,在重复安装进程。


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/6482/showart_94148.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP