- 论坛徽章:
- 0
|
2.3. HACMP心跳
和其他许多类型的集群一样,心跳用来检测网络接口,通信设备,IP标签(服务的,非服务的,永久性的IP)以及节点本身的可用性。
从HACMP V5.1开始,心跳是专有的,基于RSCT拓扑的服务(这样,HACMP V5.1仅有的增强的可扩展性,经典的通过网络模块的心跳,直接被集群管理后台控制)心跳是通过集群中每两个节点间的每个通信设备传递和交换的信息(保活数据包)。每一个集群中的节点定时的间隔发送心跳信号到其他节点,并且预期的接受心跳信号从相应的节点。如果接受的信号中断了,RSCT认可这一个错误并告诉HACMP,HACMP将执行合适的恢复动作。
心跳信息可以通过两种网络传送:
TCP/IP网络
点到点非IP网络
为了避免HACMP集群的分离,HACMP必须能区分节点故障和TCP/IP网络故障。TCP/IP网络可以因为不完美的网络元素(交换机,集线器和电缆等)而发生故障,当这种情况发生时,集群中的节点不能通过IP发送心跳信号,所以每个节点考虑到对方节点故障而都去尝试获得资源,这将导致一个潜在数据问题,特别是使用了并发的资源组时。
非IP网络是在两个节点间直接的点对点连接,不再使用IP进行心跳信号的交换,也因此减少了IP网络的故障带来的问题。假如这样的网络类型使用了,那么当IP网络故障时,节点仍然可以交换信息,可以判定网络故障而不会发生资源组的接管操作。
为了避免HACMP被分开,我们推荐配置冗余的网络(IP网络和非IP网络),同时使用这两种网络。建议使用的两个节点的群集参见Figure 2-3。
2.3.1. 通过磁盘的心跳信号
通过磁盘的心跳是HACMP V5.1的新特性,提供了对防止集群分割和单个非IP网络的附加的保护,特别是当RS-232和tmssa、tmscsi等连接太复杂或无法实现时。
这种类型的网络可以使用许多类型的共享磁盘存储(光纤通道,SSA和SCSI等),磁盘用来交换KA信息的一段只是作为AIX增强并发卷组的一部分,它不是排外性的仅作为这个目的使用,它们仍然可以用来存贮应用共享的数据。
客户需要使用目标模式的光纤通道连接,但是对于异构的FC环境(adapter,存储子系统,SAN交换机),这将很难实施和支持。
使用共享磁盘来交换信息是更可靠的非IP网络,并且不依赖于特定的硬件。此外,在一个SAN环境中,当使用光纤连接设备,非IP网络的光纤的长度仅仅是SAN的限制,因此允许非常长的点对点的网络。
当定义一个磁盘作为增强的并发卷组,这个磁盘的一部分(一部分扇区)将不能给lvm使用,将用来在两个节点间交换信息。
使用基于磁盘的心跳的详细说明如下:
一个磁盘可以用来做两个节点间的一个网络,这个磁盘在两个节点上使用相同的唯一的特定的标识的PVID。
推荐在一个存储范围内的一对节点间(或者一个磁盘柜)的一个磁盘配置磁盘心跳网络。
该磁盘需要是增强并发卷组的一部分,虽然并不要求卷组激活或者是资源组的一部分。仅仅的限制是VG必须同时定义在两个节点上。
注意:集群中并发卷组的锁机制不再需要保留磁盘的一部分来通信,而是以RSCT组服务替代。
2.3.2. 通过IP别名的心跳
对于IP网络,引入了一个新的心跳机制:通过IP别名的心跳。这使得集群不再需要或者可能再改变通信接口基本IP地址。
在IP别名上的心跳信号是配置在当HACMP服务启动时已经存在的IP地址上的。用来做这个的IP地址子网必须和已存在的每一个IP子网都不相同,并且不被定义在(/etc/hosts,BIND等)名称解析中。这样的配置不需要一个附加的可路由的子网。
作为基础和引导IP地址交换心跳信息的替代,RSCT使用HACMP定义的IP别名去完成每一个通信接口的通信组(心跳环)。
注意:当使用了IP别名的心跳,基本/引导IP地址不再被RSCT拓扑服务监控,将通过分配的IP别名去监控这些通信接口。
虽然有这些技术,HACMP仍然需要所有接口可以和其他接口通信(可以看到节点的每一个MAC地址)。IP别名使用的子网掩码和服务IP之一的掩码一致。当定义用来做心跳的IP地址时,你必须保证有足够的子网可用并不会冲突。例如:在三个网卡每节点的三节点集群中,你需要三个非路由的子网。参考图2-4和2-5。
假定每一个节点有三个网卡(en0,en1,en2),网络掩码是255.255.255.0,那么分配给每一个接口的别名如下表:
adapter/node node1 node2 node3
en0 172.16.100.1 172.16.100.2 172.16.100.3
en1 172.16.101.1 172.16.101.2 172.16.101.3
en2 172.16.102.1 172.16.102.2 172.16.102.3
通过IP别名实现得心跳的IP地址在集群同步时存储在HACMP adapter ODM库中。
在HACMP V5.1中,IP别名的心跳可以配置在建立基于IP的心跳环,使用任何一种IPAT的类型(IP别名和IP重置)。IPAT配置的类型探测HACMP是怎样操作服务IP地址/标签的:
IPAT via IP重置服务标签在base/boot地址上,没有心跳的别名。
IPAT via IP别名的服务IP地址作为别名和基本IP一起在通信接口上,并且使用别名心跳。
IP别名的心跳定义为HACMP的一个网络特性并且作为HACMP拓扑的一部分。要使用这个工具,用户必须在HACMP的网络定义中指定起始的地址。
要设置这个属性,你必须使用扩展的smit菜单(clustertopology)。这可以在定义网络时定义,也可以在稍后改变这个配置。
2.4. 共享存储的配置
大部分的HACMP配置需要共享的存储。IBM支持的多种主机存取磁盘子系统包括SCSI,SSA,ESS,FastT。
也有许多第三方的存储设备可以使用,虽然许多没有IBM的认证,请参考制造商的web。
HACMP支持的IBM存储设备的列表,包括ESS,SSA等,也支持磁带设备的存储,不支持磁带的并发。如下:
IBM 7133 SSA Disk Subsystem Models D40 and T40 (up to 72.8 GB disk modules, andup to eight nodes per SSA loop)。
IBM Enterprise Storage Server (ESS) Models E10, E20, F10, and F20 (supports up to eight nodes using SCSI and Fibre Channel interfaces via IBM FC/FICON, Feature Code: 3021, 3022, and 3023)。
IBM 7133 SSA Disk Subsystem Models D40 and T40 (up to 72.8 GB disk modules, and up to eight nodes per SSA loop)。
IBM Total Storage FAStT 200, 500, 600, 700, and 900 models。
HACMP同样支持共享的磁带设备(SCSI或者FC),但是磁带设备不支持并发访问。如下:
IBM 3583 Ultrium Scalable Tape Library Model L18, L32 and L72
IBM 3584 Ultra™ Scalable Tape Library Model L32 and D32
IBM Total Storage Enterprise Tape Drive 3590 Model H11
IBM Magstar® 3590 Tape Drive Model E11 and B11
IBM 3581 Ultrium Tape Autoloader Model H17 and L17
IBM 3580 Ultrium Tape Drive Model H11 and L11
更多的产品支持信息请登陆网站:
http://www-1.ibm.com/servers/eserver/pseries/ha
HACMP同样支持其他非IBM的存储(磁盘、磁带)子系统,相关信息请登陆网站:
http://www.availant.com/
2.4.1. 共享LVM的需求
为HACMP规划共享的LVM依赖于共享磁盘存取的方法和设备的类型。共享LVM需要考虑这些元素:
数据保护的方法
存储存取的方法
存储硬件的冗余
注意:HACMP本身不支持存储的保护,存储的保护通过AIX的LVM镜像和硬件RAID的实现。
在这一节中,我们提供了在存储层保护数据的方法,也讨论了LVM共享磁盘存取的模式。
非并发的
并发的(clvm——HACMP的并发逻辑卷管理)
增强并发模式(ECM,AIX V5.1以后新特性
2.4.2. 非并发的,并发的和增强并发的
在非并发存取的配置下,在同一时间只有一个节点可以存取共享的存储。如果一个包含共享磁盘空间的资源组移动到另一个节点,那么新的节点会激活磁盘,并检查卷组,逻辑卷和文件系统的当前状态。
在非并发的模式下,磁盘可以配置共享为:
裸物理卷
裸逻辑卷
文件系统
在并发存取模式下,存储在磁盘上的数据同时对所有的节点可用。这种模式不支持文件系统(不管是JFS还是JFS2)。
快速磁盘切换
在HACMP V5.1中,开发使用了一个新的AIX增强的并发LVM。在AIX 5L V5.2中,必须使用增强并发模式去创建新的并发卷组;增强并发的卷组也可以使用文件系统(共享的和非共享的)。当发生故障切换的状态时。这可以使快速磁盘切换选项加速共享文件系统的切换。
增强的并发卷组在资源组中的所有节点下被激活,HACMP去调整数据的存取控制。仅仅在激活资源组的节点上卷组激活在"并发的激活状态"模式,其他节点将卷组激活在"被动"模式。在被动模式时,在卷组上不允许有高级的操作。
注意:当使用了资源组的快速磁盘切换选项,非常重要的就是要有冗余的网络和非IP网络。这可以消除和避免数据的不一致性。
RAID和SSA并发模式
RAID并发模式的卷组是陈旧的定义,因为增强并发卷组模式提供了附加的能力,但是RAID并发卷组将继续被支持一段时间。RAID和SSA并发卷组在HACMP V5.1中都被支持但有一些重要的限制:
并发资源组的增强卷组需要运行64位内核的节点支持
SSA的并发模式不支持64位的内核
SSA磁盘在32位内核模式仍然可以使用SSA并发模式。
C-SPOC单元不能支持RAID并发卷组。你不得不转换这些卷组到增强并发模式(否则,AIX视为非并发的卷组)
在AIX V5.1中,可能创建一个SSA并发卷组(32位),但在5.2中,不可能创建一个并发的HACMP,所有的新的卷组必须使用增强并发模式
LVM需求
这里叙述了lvm管理的概念。
强迫激活卷组
HACMP5。1提供了新的工具,去强制激活节点上的卷组。如果在故障切换的进程中,正常的varyon命令不能激活卷组(lackofquorum),HACMP将确保在接管节点激活卷组前至少每一个Lv有一个有效的LPcopy是可用的。
强迫性的激活卷组可以让你一直保持资源组中卷组的在线状态并且有一个有效的数据copy。你仅仅可以在卷组包含镜像的逻辑卷时使用这个选项。还要小心的注意到避免创建一个分开的集群。
注意:你必须指定一个非常严格的lv分配策略来使用这个强制激活的选项。在这种方法下,LVM确定lv的copy总是在分开的磁盘上,可以增加失效时强制激活的成功概率。
这个选项当一个vg的vgda丢失时的接管是很有用的。如果没有使用这个选项,资源组将不能在接管的节点上激活,因而导致应用的不可用。
当使用了强制激活选项发生接管时,HACMP首先尝试正常的varyonvg。如果尝试因缺少quorum失效,HACMP在尝试强制卷组在线时首先检查数据的完整性-确定所有数据在卷组中都至少有一个可用的copy。如果是这样,他执行varyonvg-f,如果不能,卷组仍然离线并且资源组有一个错误的报告。
![]()
![]()
![]()
2.4.3. 选择磁盘的拓扑
HACMP5。1支持下列存储的拓扑:scsi,ssa和光纤通道(TastT和ESS磁盘子系统)。完整支持的外部存储的列表可以在ibm网站找到。
HACMP支持下列的ibm磁盘技术在HACMP中作为外部共享磁盘使用。
IBM2105企业存储服务器
ibm2105企业存储服务器提供并发的连接和磁盘存储共享在多种开放的系统平台上。除了ibm的p系列服务器机器,许多其他的平台也被支持。
由于共享存储环境得多平台得支持,为了避免冲突,非常重要得就是配置适当得LUN标记和zone配置来提供安全得数据存取。ESS使用ibm得ssa磁盘技术。ESS提供了内建的可用性和数据保护。RAID技术用来保护数据,同时,磁盘有故障前期分析特性预测将会出现故障。使数据保持可用。ESS事实上有所有的组件冗余避免内部组件损坏而导致故障,从而提供了保护。ess管理两个节点的集群通过内部的高速总线连接到内部的存储(ssa磁盘),每个节点上有精确等同的定义。因此,当内部节点失效,存储对系统仍然有效(可用性)。
更多的信息参考ibm网站。
一个典型的使用ESS的HACMP集群的例子如图2-6。
ibmFastT700和900中等存储服务器
IBMFatsT900和700存储服务器传输超越磁盘性能和突出的可靠性来为苛刻的应用程序提供良好的计算环境。
IBMFatsT系列存储子系统是提供好的可测量的,高性能的和数据保护的中等解决方案。在FatsT架构中,虽然不是作为久经考验的ESS实现,仍然提供基于冗余组件(存储控制器,电源支持和存储连接器)的可靠性。
FastT700和900架构实现了在主机和存储端的本地的光纤通道协议。他不再支持scsi,并且不专注于提供两个控制器之间的高速度,但是提供了控制器的无间断的错误切换和主机端的数据缓存。
需要完整的信息关于ibm的存储解决方案,请访问ibm的网站。
典型的FatsT连接的HACMP如图2-7。
IBM串行存储架构磁盘子系统
SSA存储架构提供一个更离散组件的解决方案,提供了减少单点故障的特性。
SSA存储在HACMP环境通过冗余硬件提供了高可用的和电源,磁盘热切换的特性(在线维护)。
SSA存储也提供了RAID在hba(hostbusadapter)层。
注意:如果使用ssa的raid特性,那么HACMP只能连接两个节点。
ibm的7133子系统能在HACMP中提供并发存取的配置。请参阅7133相关配置。如图2-8。
2.5. 软件规划
在HACMP规划的进程中,很重要的一步就是选择集群节点中软件运行的层次。
节点软件规划的考虑因素有:
Ø 操作系统需求:AIX版本和推荐层次。
应用的兼容性:确保应用的所有需求适合并且在HACMP环境中支持。Ø
Ø 资源:使用资源的类型(IP地址,存储配置、必要的话还有NFS等)。
2.5.1. AIX级别和相关的需求
在安装HACMP之前,你必须操作系统的需求级别。本红皮书书写时的推荐层次如下表:
HACMP Version AIX OS Level AIX APARs RSCT Level
HACMP V5.1 5100-05 IY50579,IY48331 2.2.1.30或更高
HACMP V5.1 5200-02 IY48180,IY44290 2.3.1.0或更高
HACMP V5.2 5100-06 IY54018,IY53707,
IY54140,IY55017 2.2.1.30或更高
HACMP V5.2 5200-03 IY56213 2.3.3.0或更高
有关HACMP V5.1和V5.2的推荐维护级别的最新的信息请访问IBM网站:
http://www-912.ibm.com/eserver/support/fixes/fcgui.jsp
注意:
Ø 要在VPATH磁盘中使用C-SPOC,需要设备驱动子系统(SDD)1.3.1.3或更高版本。
Ø 要使用HACMP在线规划工作表,AIX 5L的Java运行环境版本必须高于1.3.1,同时要有图形显示器(本地或远程)。
HACMPØ V5.1和V5.2支持在AIX 5L V5.2下访问磁盘系统的多路I/O设备驱动(MPIO)。
下列基本操作系统(BOS)组件需要在HACMP之前安装:
Ø bos.adt.lib
bos.adt.libmØ
bos.adt.syscallsØ
Ø bos.net.tcp.client
bos.net.tcp.serverØ
bos.rte.SRCØ
Ø bos.rte.libc
bos.rte.libcfgØ
bos.rte.libcurØ
Ø bos.rte.libpathreads
bos.rte.odmØ
Ø bos.data
当使用增强并发资源管理时,还需要下列组件:
bos.rte.lvm.5.1.0.25或更高(在AIX 5LØ V5.1下)
bos.clvm.enhØ
完整推荐维护级别的列表,请参考IBM网站:
http://www-912.ibm.com/eserver/support/fixes/fcgui.jsp
2.5.2. 应用兼容性
HACMP是可伸缩的高可用的解决方案,事实上可以通过在独立的AIX节点上使用HACMP群集运行应用以保护应用。
当开始一个应用的规划时,需要考虑下面的方面:
Ø 应用在AIX系统的版本上的兼容性。
应用在实现高可用的存储方法上的兼容性Ø
Ø 你必须知道所有应用和平台相互依赖的东西,也就是说应用程序所有的文件分布(永久性数据、临时文件、套接字、可能的话还有管道)。
Ø 你必须提供一个无人值守的应用启动和停止的脚本。并且应用可以在重新启动时从错误中(例如:节点应用崩溃)恢复。
重要提示:不要加入在独立节点上就不能正确执行的应用或者你不能确定应用依赖的文件等!!!
Ø 如果你计划使用应用的监控,你应该提供应用的监控工具(方法,行为和脚本)。
Ø 应用客户端的依赖(当服务器重启时客户端的行为)。
应用网络的依赖(sockets、route等)。Ø
Ø 许可证的问题,如果应用依赖于CPU ID,你应该考虑购买标准的在每个节点上,同时,如果应用基于处理器个数,那么要确定,当错误切换时,许可证不被破坏。
应用服务器
依照HACMP的定义,一个应用服务器是HACMP当激活资源组时启动应用和资源组离线时停止应用的脚本的集合。一旦应用启动,HACMP能监视应用,并且当应用运行不正确时执行动作。应用监控可以在进程级,也可以使用定制的方法(例如,一个多处理的进程数据库引擎等)执行。
注意:应用监控在HACMP/ES 4.4中引入,是基于RSCT事件管理的定义。从HACMP 5.2开始,事件管理被资源监控控制器(RMC)替代,两者功能相同,但是RMC提供了更多的弹性。从HACMP 5.2开始,同样可能去监控应用的启动。
HACMP也提供了应用可用的分析工具,可以用来审计所有的应用可用性,评估集群的环境。
需要应用服务器和其他资源的信息,请参考3.5 资源组配置。
2.5.3. 规划NFS配置
HACMP的一个典型的应用就是对客户机和应用服务提供高可用的HA-NFS。这是很有用的,特别是集群运行一个相互接管的交叉挂接的NFS。从HACMP 4.4开始,HA-NFS已经整合到HACMP中,不再是一个单独的产品。
使用NFS的一些注意事项:
Ø 对于要输出为NFS的共享卷组来说,卷组的Major Number在所有服务文件系统的vg的所有集群节点上是一样的。
Ø 在AIX中,当你使用mknfsexp命令输出文件系统和目录时,/etc/exports文件将被创建和更新。也就是说,在HACMP中,输出为NFS的文件系统和目录必须在资源组配置中指定。
Ø 如果你需要这些文件系统的一些可选配置项,那么你就需要创建/usr/es/sbin/cluster/etc/exports文件。
Ø 对于所有输出文件系统的资源组来说,"File system mounted before IP address configured"属性必须置为"true"。
HACMP的脚本包括缺省的NFS行为。你需要去改变这些脚本去适合你的配置。Ø
Ø 在HACMP 5.1中,在附加的层叠(cascading)资源组中你可以在rotating和定制资源组中配置高可用的NFS。
注意:NFS锁定功能限制为两个节点的群集,这个功能提供了当主NFS服务失效时允许备份的进程去恢复当前的NFS行为,保留NFS文件系统的锁定和副本缓存(dupcache)。
2.5.4. 许可
许多的软件供应商需要你的每一个应用在每一台物理机器上或者在SMP机器上每个CPU有唯一的许可证。通常,许可证激活码在软件安装时输入。然而,在HACMP环境中的切换状态,如果应用在另一个节点重新启动,你必须确定你在新的机器有必须的激活码;否则,应用不能正确的启动。
应用也可能有唯一的节点绑定的许可证(每一个机器上有不同的许可证文件)。
一些应用限制限制集群中漂移的应用的许可证的数量。要避免这个问题,你需要有足够的许可证,这些应用可以同时在多个节点上执行,特别是在并发的应用中。
2.5.5. 客户端连接
当资源组切换时,应用在另一个节点上启动,应用必须知道这个动作。在某些情况下,应用客户端使用本机ARP缓存去重新连接服务器。在这种情况下,有两种可能的结果:
Ø 持有服务IP的网络使用通过IP置换得IPAT实现了本地MAC地址的切换(因此,客户端机器ARP缓存没有被更新)。
Ø 当网络或节点事件发生时HACMP使用clinfo程序调用/usr/es/sbin/cluster/etc/clinfo.rc脚本。缺省的,这个动作更新系统的ARP缓存并且指定客户端的ARP缓存反应网络的改变。你可以定制这个脚本以进一步满足需求。
clients运行clinfo后台守护进程能在集群事件后快速的连接到集群。
注意:如果你使用IPAT via IP别名,确保你的客户端支持支持ARP刷新功能。
如果HACMP节点客户端在同一个子网上,客户端不需要运行clinfo,你可以间接的在集群节点上通过ping客户端来刷新客户端的ARP缓存。
你可以在集群节点上通过添加你想要通知的客户端的IPlabel和地址到clinfo。rc脚本中的PING_CLIENT_LIST变量。一旦集群事件发生,这个脚本就会运行下面的命令到PING_CLIENT_LIST中的每一个主机:
#ping -cl $host
当client在不同的子网时,确保路由器的ARP缓存在发生IPAT事件时得到更新;否则,客户端在重连时会有预期的延迟。
2.6. 操作系统空间需求
在HACMP 5.1中,包括集群校验程序(clverify)和新的集群通信后台(clcomdES)都需要/var文件系统下附加的空间。
要得到详细的消息和附加的调试信息,在每个节点的/var下需要满足:
Ø 20M仅一次,包括:
- /var/HACMP/clcomd/clcomd.log 2M
- /var/HACMP/clcomd/clcomddiag.log 18M
Ø 在/var/HACMP/odmcache目录下附加的(1M*集群中的节点数)空间。
4M每个节点集群的效验数据。Ø
Ø 2M的集群效验log(clverify.log[0-9])。
在集群的每个节点中,效验工具在需要/var下4M的空间,clverify可以在同一时间最多保持四份节点效验数据的拷贝(节点初始化和同步时)。
/var/HACMP/clverify/current//*包含当前执行的效验的日志。
/var/HACMP/clverify/pass//*包含最后通过的效验的日志。
/var/HACMP/clverify/pass。prev/ /*包含倒数第二次通过效验的日志。
/var/HACMP/clverify/fail//*包含最后一次失败的效验日志。
同时,/var/HACMP/clverify/clverify.log和它的拷贝消耗1-2M的磁盘空间。
2.7. 资源组的规划
资源组是一个包含HACMP执行高可用的资源的一个逻辑实体。资源包括:
Ø 存储空间(应用程序的代码和数据)
- 文件系统
- 网络文件系统
- 裸逻辑卷
- 裸物理磁盘
服务IP地址/标签(客户端连接应用时使用)Ø
应用服务器Ø
- 应用启动的脚本
- 应用停止的脚本
要通过HACMP实现高可用,每一个资源都必须包含在资源组中。
HACMP在集群事件发生改变时通过在节点间移动资源组来确保集群资源的可用性。HACMP在下列状态时控制资源组的行为:
Ø 集群启动
节点失效Ø
节点重组Ø
Ø 集群关闭
在上述的群集下,HACMP的资源组的行为定义在:
当节点(一个或者几个节点)在集群启动时需要获取资源组;Ø
Ø 当拥有资源的节点失效时接管节点接管资源组时;
Ø 不管资源组恢复到刚刚发生故障而恢复的节点,还是当前拥有的节点。
集群中的节点优先级关系决定了哪一个节点最初控制资源组并且当一个最初的节点在失效后重新加入集群接管对资源组的控制。
资源组接管关系定义为:
Ø 层叠式
轮转式Ø
并发式Ø
Ø 定制式
层叠的,轮转的和并发的资源组是在HACMP 5.1以前的类型。因为定义这些类型的难于理解,在HACMP V5.1中引进了新的定制资源组。
这里仅仅有一个常化HACMP术语和让HACMP的概念容易理解的步骤。从HACMP V5.2开始,仅仅有定制资源组存在。
2.7.1. 层叠式资源组
层叠式资源组定义了一个所有可以控制资源组的节点列表并且每一个节点有一个托管资源组的优先级。
一个层叠式资源组的行为如下:
Ø 在集群启动时,层叠式资源组在缺省的节点上激活(资源组的最高优先级的节点上)。
同时,另一个称为“非活动的接管”属性的可以用来指定如果高优先级的节点在集群启动时不可用的时候在低优先级的节点上激活。
Ø 当一个节点失效时,一个层叠式资源组在资源组优先级列表中的下一个节点上激活。
同时,可以指定"动态节点优先级"失效切换的进程将根据动态的属性(高cpu空闲等)确定接管资源组的节点。
Ø 当失效节点重新接入集群,层叠式资源组将重新切换到缺省的节点上。
附加的,可以指定"层叠不需要回退",资源组将依然保持在接管节点上即使一个高优先级的节点重新接入集群。
总结一下,层叠式资源组有下面的属性:
Ø 非活动性接管允许你精妙的定义主节点不可用时对资源组的接管;
Ø 当拥有资源组的节点失效时,该资源组可以根据节点优先级列表切换到下一个可用的结点。节点优先级列表可以通过两种方法配置:使用默认(RG配置时的节点列表)或者设置一个动态节点优先级(DNP)策略。
Ø 无后退层叠(CWOF)属性改变了切换行为,使用CWOF属性可以避免高优先级节点恢复可用时不必要的RG切换(由客户中断引起的)。在这种模式下,可以在不影响客户的时间手动将RG移动到它的主节点上。
2.7.2. 轮转式资源组
对于一个轮转式资源组来说,节点的优先级列表仅仅用来决定哪一个节点来接管失效的节点。
在集群启动时,在节点优先级列表中第一个可用的节点将激活资源组;一旦在一个接管的节点上激活,它不会切换回高优先级的节点即使高优先级节点重新可用;在轮转时资源组中不使用DNP(动态的节点优先级);当在同一个节点上配置多个轮转的资源组时,为了控制首选的资源组的定位,每一组都要从节点群中分配一个不同的高优先级节点。当集群启动时,每一个节点将尝试去获取它自己具有高优先级的资源组;如果所有的轮转资源组已启动,新节点的加入仅能作为这些资源组的后备节点;如果所有的资源组都没有激活,新加入的节点将仅仅去获得这些资源组的一个,其他的资源组仍然保持非激活状态。
无论如何,如果存在多个网络可供资源组移动,一个节点可能获得多个资源组,每一个网络上只能有一个。
2.7.3. 并发的资源组
和名称一样,一个并发的资源组可以在多个节点上同时激活,当集群启动时,资源组将在列表的所有节点上激活,没有顺序。
对并发资源组来说,没有节点间的优先级,他们是平等的节点,如果一个节点失效,其他的节点仍然一样提供服务,资源组不能被移出。
管理并发的存取应用的数据可能需要附加的并发软件。
2.7.4. 定制资源组
为了简化资源组的管理和理解,HACMP V5.1引入了定制资源组的类型。资源组指定的名称可能会使新的用户(层叠,轮转和并发)混淆:
Ø 他们不能清晰的指出潜在的资源组的行为。
Ø 附加的资源组参数将进一步使定义资源组变得复杂:无后退层叠和非活动接管
同时,在一些情况下,用户需要组合一些行为,他们不是被标准的RG定义的:
Ø HACMP V5.1引入了定制的资源组
- 用户必须明确的指定启动的需求,切换和回来的行为。
- RG启动和切回能通过用户设定和FAllback计时器控制。
- RG接管也可以通过用户的定义动态节点优先级影响。
Ø 局限性:(仅仅HACMP V5.1)
- 定制资源组仅支持IPAT-via-别名服务IP的标签和地址。
- 没有站点和复制资源(HACMP-XD)支持。
启动参数选择
Online On Home NodeØ Only:在节点启动时,RG将仅仅使得高优先级的节点在线,这个行为等价于层叠RG行为。
Online On FirstØ Available Node:在节点启动时,RG将在第一个节点上激活,这个行为等价于轮转式RG或者使用非活动的接管的层叠式RG。如果配置了一个设定时间,它将影响RG的这个行为。
Ø Online On All Available Nodes:RG将在资源组的所有节点上激活。这等价于并发的RG行为。这个启动参数将不考虑某些fall-over和fall-back参数。
切换(fall over)参数选择
切换至列表中的下一个优先节点:RG将切换到下一个可用的节点上。这个行为等价于层叠式RG和轮转式RG。Ø
Ø 使用DNP切换:RG将基于DNP计算结果去切换,资源组必须指定DNP的优先级。
Ø 使其离线(仅仅在错误的节点上):RG在错误时不发生切换,而是简单的置为离线。这个行为大部分的类似于并发的资源组。
后退(fallback)参数选择
Ø 退回高优先级节点:RG将在一个节点重新可用时切换倒高优先级的节点上。这个行为等价于层叠的资源组的行为。一个fall-back计时器将影响这个行为。
Ø 从不后退:资源组将待在它在的地方,即使一个高优先级的节点重新在线。这个行为类似于轮转式RG的行为。
2.7.5. 应用监控
作为资源组管理的一个附加方面,HACMP能通过下列两种方法监控应用:
Ø 应用的进程监控:探测死进程,使用RSCT事件管理能力。
Ø 应用定制的监控:基于自定义的监控方法(程序或脚本)监视应用的健康状态。
注意:你不能使用应用进程监控一个shell脚本启动的应用,或者应用的进程对应用来说不能反映应用的健康状态的应用。
要监控一个shell脚本的应用,你将不得不定制监控的方法(例如,Apache web server)。
当应用监控是激活状态时,HACMP的行为如下:
Ø 对应用监控进程来说,一个通知集群管理器的内核的钩子监控倒进程已经死掉的话,集群开始应用的恢复进程。
当恢复的动作执行时,你必须提供一个方法清除和重新启动应用(定义的应用起停的脚本可能会用上)。
HACMP在发送警告信息或者移动到另一个节点前会尝试重新启动应用和等待应用稳定一段时间。
Ø -对于定制应用监控(定制的方法)除了应用清理和重新启动的方法,你还必须提供一个程序或者脚本用来执行一个周期的测试。
规划和配置一个进程的监控需要检查下列方面:
Ø 检查应用是否能被进程监控。
指定和核查要监控的进程的名称,在配置应用监控时必须强制的使用准确的进程名称。Ø
Ø 指定要监控的应用的实例数(进程的数量)。缺省的值是一个实例。
Ø 指定开始监控等待的时间(秒)。
注意:在很多情况下,这个值不能设为零。例如,在一个数据库应用中,你希望延迟一些监控知道启动脚本和初始化数据库完成。
Ø 重启的计数,表示在执行其他动作时尝试去重启应用的次数。
间断(秒)。是应用在重新设置重启计数前保持稳定的时间。Ø
Ø 重启计数器归零后应用依然不能运行的时候才去的动作,默认选择是通告,它作为通告集群失效的事件运行;可将选择改为切换,在运行应用的节点失效时将应用和资源组切换至下一个高优先级的节点上。
Ø 如果有需要,还有重启动的方法。(前提是重启计数器不为零)
如果计划安装自定义的监视方法,还应检查:
Ø 是否你有用来检查制定应用的程序或脚本。
Ø 选举间隔(以秒计):监视方法的运行频率。如果监视(进程)在选举间隔内没有响应,应用就会被认为失效,此时恢复进程启动。
Ø 用户自定义的监视(进程)如果在选举间隔内没有返回,即表示该进程应被杀掉。默认的Kill进程信号是SIGKILL。
Ø 开始监视前的等待时间(以秒计)。例如:在一个数据库应用中,推荐监视应在启动脚本和数据库初始化搜索后再运行(换句话说,应用被认为出错后恢复进程才能开始初始化)。
Ø 重启计数器:应用执行其他动作前场是重新启动的次数。
保持计时器:应用在复位重启计数器前应保持状态的时间。Ø
Ø 应用在重启计数器归零后执行的动作。
2.8. 规划灾难恢复
从HACMP V5.1开始,HAGEO和GeoRM作为IBM HACMP/XD(扩展距离)特性被集成在HACMP中。
HAGEO软件产品为构建灾难冗余的计算机环境提供了一个灵活的、高可用性平台。HAGEO组件可以通过TCP/IP点到点网络不受距离限制的在两个不同的地理站点间进行数据镜像。
HAGEO提供了自动探测、通告和在失效中恢复整个地理站点。
本书中的容灾策略仅讨论在两个站点间进行:原始站点和恢复或者备份站点。数据恢复策略应达到以下结果:
Ø 数据就绪级别:
- Level 0:没有。容灾中不提供。
- Level 1:定期备份。需要恢复的数据被备份并发送至另一个地方。
- Level 2:有准备的前向滚动。作为周期性备份的附加,数据更新日志同样被发送至另一个地方。在恢复站点恢复时只恢复最近记录的数据。
- Level 3:前向滚动或前向恢复。在恢复站点的磁盘上维护着一份数据的影子拷贝,更新日志会被恢复工具接收到并且将其周期性的应用到影子拷贝中。
- Level 4:实时前向滚动。和前向滚动一样,源站点记录的更新在同一时间被传输并应用。这里实时的操作不会影响源站点的响应时间。
- Level 5:实时远程更新。在发送交易响应前源站点和恢复站点的数据拷贝同时被更新。
站点互联选项Ø
- Level 0:没有。在站点间或数据传输。
- Level 1:手动传输。不提供互联,需要传输的数据被手动发送至另一个地方。
- Level 2:远程磁带。数据通过远程磁带进行电子传输。急件和收据是自动的,跟踪既可以设为自动,也可以手动。
- Level 3:远程磁盘。数据通过远程磁盘进行电子传输。急件、收据和跟踪都是自动的。
恢复站点就绪Ø
- 冷站点:通常冷站点是指在正确的架构下,极少或没有数据处理设备的环境。该设备被作为恢复进程的第一步来安装。灾难发生时、周期性备份和有准备的前向滚动都可以将这个站点存储的数据装走。
- 温暖站点:它有数据处理设备安装和操作,这个设备被用来处理在灾难发生时其他的数据进程任务。数据处理资源可以用来存储数据,例如日志等。此站点的恢复(进程)经常做关闭和备份的工作。周期性备份和有准备的前向滚动数据都可以在该站点存储以便在灾难中快速恢复。
- 热站点:有数据处理设备安装和操作,包括频繁或有规律的存储以减少恢复时间。在前向滚动和实时远程更新中可以实现所有级别。
HAGEO软件提供更高级别的灾难恢复:
Ø Level 5;
Level 3;Ø
Ø 热站点就绪。
此外,在HAGEO中,恢复站点同样可以活动的进行数据处理和执行日常工作。实际上,每个站点都是其他站点的备份,因此它最小化了安装成本。
HACMP对容灾的贡献
HACMP基本软件提供了一个宽松的群集环境来防止在群集中个别系统组件(像处理器、网络、网络适配器)的SPOF。它确保了在一个站点内的计算机环境下的高可用性。
现在你已经可以定义HACMP群集组件在一个站点内的系统组件和通过HACMP基本软件功能保持在该站点中的系统组件的高可用性。更多信息请参考HAGEO拓扑下的HACMP/XD:规划管理指南——SA22-7956。
图2-9表示一个使用远程镜像(GeoRM)选项的地理集群。
![]()
![]()
![]()
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/10475/showart_1018679.html |
|