Chinaunix

标题: 翻译HACMP V5.2 [打印本页]

作者: gaoxintian    时间: 2006-03-28 17:35
标题: 翻译HACMP V5.2
第一章        介绍
本章内容包括对IBM针对AIX产品线的高可用性集群多处理系统的介绍以及IBM高可用产品的概念
本章将讨论以下主题:
        什么是HACMP?
        历史与发展
        高可用性的概念
        高可用性Vs容错
1.1.        什么是HACMP?
在我们解释什么是HACMP以前,我们先来定义一下高可用性的概念。
High availability
在当今复杂的环境下,成功实现IT应用的一个关键要素就是提供不间断的应用服务。HA就是这样一个可以通过消除计划内/计划外宕机事件从而向客户应用提供不间断服务的部件,它能达到消除从硬件到软件的单点故障(SPOFs)。
一个高可用性解决方案可以保证方案中任何组件的失效(包括硬件、软件或系统管理)都不会造成客户无法访问应用和应用数据。
高可用性解决方案可以通过恰当的设计、计划、硬件选择、软件配置以及细心控制改变管理方法来消除单点故障。
Downtime
停机时间是指应用程序不能为客户端提供服务的时间。停机时间分为:
        计划内:
-        硬件升级
-        维修
-        软件更新/升级
-        备份(离线备份)
-        测试(对群集确认必须进行周期性测试)
-        发展
        计划外:
-        管理员过失
-        应用失效
-        硬件失效
-        其他不可抗力(天灾)
IBM针对AIX的高可用性解决方案——HACMP给予饱经考验的IBM群集技术,它包括以下两个组件:
        高可用性:该进程保证应用在用户复制和/或共享资源时是可用的。
        群集多处理:该进程提供在同一节点上多个应用共享或并发访问数据。
基于HACMP的高可用性解决方案提供自动失效检测、诊断、应用恢复和节点重新控制。在恰当的应用中,HACMP还可以在并行应用处理中提供对数据的并发访问,从而提供更高的可扩展性。
标准的HACMP环境如图1-1。

1.1.1.        历史与发展
IBM HACMP最早可追溯至90年代。HACMP在1990年开始为RS/6000机器上的应用提供高可用性解决方案。
我们不会提供关于更早版本的信息,原因在于这些版本要么已经不被支持或者已经不再使用,我们只提供近期一些版本的相关信息。
HACMP V4.2.2
较早版本,引入了基于RSCT(Reliable Scalable Clustering Technology)技术的增强的可扩展版本,组、事件管理服务都从并行系统支持(PSSP)中引入。
HACMP V4.3.X
该版本引入了更多的支持,包括32节点、增强的C-SPOC、ATM网络、HACMP 任务指南(图形化的HACMP简单配置)、多脚本(安装前、后)、FDDI MAC地址接管、监视和管理增强、节点到节点的迁移以及AIX快速连接支持。
HACMP V4.4.X
该版本中增加了Tivoli集成、应用监视、无退却层叠、增强的C-SPOC、改良的迁移支持、集成HA-NFS功能和软件副本文档(pdf或者doc)。
HACMP V4.5
在线这个版本中要求AIX5L以上,自动配置发现特性、在每个网卡上的多服务标签支持(通过ip aliasing),固定IP地址、64位应用支持、监视和恢复丢失的VG quorum。
HACMP V5.1
该版本在配置简单化和性能增强方面都有了重大改变,V5.1的主要特性如下:
        SMIT标准和扩展配置路径
        自动配置发现
        定制资源组
        非IP网络基于通过磁盘的心跳
        快速磁盘接管
        心跳通过IP aliases
        HAS不再保留,现在只有基于IBM RSCT的HACMP/ES
        通过使用群集通讯进程提高了安全性(消除了使用AIX r命令,也消除了对/.rhosts文件的依赖)
        为群集的定制和同步提高了性能
        标准化HACMP术语
        简单化配置和维护
        增强的在线计划工作表
        强制要求varyon VG
        自定义资源组
        接管节点上服务IP/标签心跳监视
        心跳通过IP别名
        心跳通过磁盘
        不同的C-SPOC增强
        GPFS集成
        快速接管
        群集确认增强
        改良的资源组管理
HACMP V5.2
从2004年7月开始,新的HACMP V5.2在管理、配置简单化、自动化和性能方面增加了不少内容:
        2-节点配置助手,可以通过SMIT菜单或者Java™接口
        文件收集
        用户密码管理
        Classic资源组不再使用,取而代之的是自定义资源组
        自动测试进程
        自动群集校验
        增强的OLPW可以导出已存在的HACMP群集的配置
        事件管理被资源监视和AIX的一个控制子系统(RMC)所取代
        增强的安全性
        资源组依赖关系
        自复原群集
注意:本书出版时HACMP V5.1和V5.2都已出现,但认证考试仅包括V5.1的主题
1.1.2.        高可用性的概念
需要保护什么?从根本上讲,在一个关键环境中IT方案就是要提供连续的服务和数据保护!HA就是完成不间断服务这一目标的。高可用性基于硬件的可用性和软件(操作系统及其组件)、应用程序和网络组件的可用性。
实现一个高可用性解决方案,你需要:
        冗余服务器
        冗余网络
        冗余网络接口卡
        监视
        故障检测
        故障诊断
        自动接管
        自动重新控制
实现HACMP的主要目标就是消除单点故障。
1.1.3.        高可用性Vs容错
系统发现和处理软硬件故障可以定义为两种:
        容错系统
        高可用性系统
容错系统
它是提供冗余的设计为不间断操作而不管故障的发生(除非天灾造成整个站点瘫痪)。在这样的系统中,所有的组件都是双份的(不管是硬件还是软件),CPU、内存、磁盘都有特殊的设计来提供不间断服务,甚至于一个子系统失效。
这样的系统是非常昂贵和非常专业的。实现一个冗余系统需要大量的努力和对所有组件的高度定制。只有在要求0宕机的环境下,容错系统设备和方案才有需求。
高可用性系统
配置为高可用性的系统是一组软件、硬件的组合可以保证系统失效后可以在可接受的宕机时间内恢复。在这种系统中,软件负责监测到环境故障后将应用交给另一个机器实现队员机器的接管。因此,在这种环境下重要的是消除SPOF。例如,如果及其只有一个网络连接,就需要提供第二块网卡以备主网卡失效后接管。另一点就是通过将数据放在所有节点都可以访问的共享磁盘上并实现镜像。
HACMP软件提供一个框架以及一系列的工具来将应用程序集成到一个高可用性系统中。应用系统被集成到HACMP群集中需要公正的定制(非应用级别,而是HACMP和AIX平台级别)。
HACMP是一个灵活的平台,它允许集成AIX平台的大多应用,在一个合理的代价下实现高可用性系统。
1.1.4.        高可用性解决方案
高可用性解决方案优点如下:
        标准化的组件
        可以在已有的硬件上实现
        可以和大多应用协同工作
        支持大多数磁盘和网络类型
        合理的价格实现优秀的可用性
IBM针对p系列服务器的高可用性解决方案有些独特的优点。这些优点包括:
        Proven解决方案(长达14年的产品发展)
        灵活性(事实上在单机AIX上运行的应用在HACMP中都被保护)
        使用原来的硬件组件
        Proven客户支持
考虑提供高可用性解决方案包括:
        详尽的设计和计划
        消除单点故障
        选择适当的硬件
        正确执行(没有捷径)
        严格的系统管理练习
        文档化操作步骤
        全面测试
1.2.        HACMP的概念
HACMP的基本概念可以作如下分类:
        群集拓扑
包含基本的群集组件——节点、网络、通讯接口、通讯设备、通讯适配器。
        群集资源
被设为高可用性的实体(例如文件系统、裸设备、服务IP标签、应用等)。所有资源被组织成资源组(RG),HACMP保持唯一实体——资源组——的高可用性。资源组可以被一个节点访问或者在并发应用中同时有多个节点访问。
        Fallover
在活动节点出现故障时,将资源组从活动节点转移到备份节点的动作。
        Fallback
原来的活动节点恢复时,将资源组切换回原节点的动作。这是将失效节点重新集成到集群的标准动作。
1.2.1.        HACMP术语
要理解HACMP的正确功能并利用它,就必须知道一些术语:
        群集
为共享资源和相互通讯而通过网络连接在一起的独立主机(节点)或者LPARs称为群集。HACMP负责定义在协同的系统中那个节点提供服务那个节点不提供服务。所有节点共同负责维护应用的功能可用(在群集节点失效时)。
        节点
在群集中的所有运行AIX和HACMP软件的IBM p系列服务器(或者LPAR)都是节点。每个节点都有一个资源集(磁盘、文件系统、IP地址、应用)在该节点失效时可以被群集中其他节点接管。
        资源
资源是在群集配置中可以从一个节点转移到其他节点的逻辑组件。所有必须提供高可用性应用的资源被构成资源组(RG)。当节点失效时,资源组中的组件被一同从一个节点移动到另一个节点。一个群集可以有多个RG,从而提供节点的效率(也就是HACMP中的Multi-Processing)。
        接管
在群集内部节点之间传送资源的操作称为接管。如果一个节点发生硬件故障或AIX故障,它的资源应用会被移到另一个节点。
        客户
客户就是可以通过局域网访问群集节点应用的一个系统。客户通过运行客户端程序连接到应用所在的服务器上。
1.3.        HACMP/XD
AIX下的HACMP是基于软件实现解决连续操作的问题。它致力于恢复计算机、适配器、以及单一站点的网络故障。标准HAGEO如图1-2。

要实现异地容灾应用,还需要有附加的软件。HAGEO提供:
在不同的地理站点间实现群集
HAGEO将HACMP扩展到两地的数据中心,它在站点级别防止了群集单点故障。远程镜像提供给每个站点一个关键数据的拷贝。异地容灾的每个站点都可以不间断地运行关键应用即使一个站点发生天灾。
自动失效监测和通告
HAGEO通过HACMP提供自动监测站点或者地理网络失效。它可以发起恢复进程并向系统管理员报告他所发现的错误,同时接管相应应用。
自动Fallover
HAGEO包含时间脚本来恢复站点会地理网络故障。这些脚本都集成在标准的HACMP时间脚本中。和HACMP中一样,你可以通过添加脚本来自定义配置行为。
灾难快速恢复
HAGEO同样在可操作站点间提供快速恢复数据和应用。远程镜像进程确保当天灾降临时数据在第二个站点始终可用。恢复时间一般需要数分钟即可,这还不包括应用恢复的时间。
站点恢复时自动重新同步数据
HAGEO用来重新在每个站点间同步的进程是站点恢复进程的一部分。重建站点的节点会自动更新站点失效期间接受的数据。
可靠的数据完整性和一致性
HAGEIO的地理镜像和地理消息组件确保如果站点失效,存活的站点的数据和失效站点的数据的一致性。当失效站点重新加入群集时,HAGEO从可操作站点更新数据以确保数据的一致性。
灵活的、可升级的配置
HAGEO软件支持大范围的配置,允许按你的需求配置一个灾难恢复解决方案。在一个HAGEO群集中最多可以有8个节点,每个站点的节点数目可以灵活配置。既然远程镜像和他所支持的磁盘设备一样是独立的,HAGEO也是独立于文件系统和数据库的。因为镜像是透明的,使用远程镜像的应用不需要做任何的改变。
1.3.1.        HAGEO/XD:HAGEO componets
本软件有三大重要功能:
        地理镜像(远程镜像):
数据通过第一个站点进入第二个站点的镜像过程有一个逻辑设备和一个伪设备驱动。TCP/IP被用作数据镜像的传送器。地理镜像可以使用同步或异步模式,这取决于站点间的通讯带宽以及应用的传输量(取决于数据的变化量)。
        地理信息:
在两个站点间使用地理镜像传输数据时提供可靠的数据和消息。
        地理拓扑:
在整个站点发生灾难时提供集成化的地理镜像工具和HACMP工具提供的故障自动监测和恢复。
        灾难恢复:
当一个站点发生故障时,其他存活站点的节点上的群集管理器会立刻监测到这一事件并切换脚色以保持地理镜像应用的可用性。同样,如果构成群集的主干网络故障,站点中的群集管理器处于无人控制状态,那么群集管理器就会使自己宕机以确保数据不会有分歧。
1.3.2.        HACMP/XD:HAGEO的基本配置
可以配置HAGEO为HACMP支持的任何配置:包括备用、单方面接管、互相接管以及并发访问配置。
        备用配置
备用配置是传统的硬件冗余配置,只有当一个节点失效时其他节点才会启用。在HAGEO中,这就转化为有一个空闲站点。当然,它不可能完全空闲(要处理地理镜像进程)。但是在这个站点的节点不会执行应用。
        接管配置:
在接管配置中所有节点都处理应用;不存在空闲站点。它包含:
-        站点内(本地)接管;
-        远程单向接管;
-        远程双向接管。
        并发配置:
在并发访问配置中,一个站点的所有节点对并发卷组进行同时访问并拥有相同的磁盘资源,另外的站点也是同样的配置。如果一个节点离开站点,资源的可用性不受影响,因为其他节点会将卷组varyon起来。如果一个站点故障,其他站点将向失效站点提供并发访问一个并发访问可以从群集中任何一个节点访问。HACMP 群集Lock Manager必须运行在群集的所有节点上。包括跨地理环境的节点,并非所有的数据库都可以并发访问。
1.3.3.        HACMP/XD PPRC 集成特性
这一特性最初在HACMP V4.5 PTF5和HACMP V5.1中引入,它提供自动远程站点fallove和自动远程拷贝应用数据,应用于所有站点使用IBM ESS和PPRC(Peer to Peer Remote Copy)功能提供存储卷镜像。
当主站点失效后,数据在第二站点依然可用(通过PPRC同步)。第二个站点必须激活数据拷贝以用来处理交易。
HACMP/XD PPRC集成特性提供自动数据分割拷贝以保证主站点失效后重新在线时的可用性。更多信息请参阅SA22-7955。

1-1.JPG (23.45 KB, 下载次数: 171)

1-1.JPG

作者: gaoxintian    时间: 2006-03-28 17:36
近期工作轻松,希望可以在大家的鼓励下翻译完这本书
作者: fzm    时间: 2006-03-28 17:39
鼓励一下。
作者: jonathan_crl    时间: 2006-03-28 19:36

作者: beginner-bj    时间: 2006-03-28 19:47
鼓励!鼓励!
加油!加油!
作者: zlg88    时间: 2006-03-28 19:49
很好的想法!!
作者: 秋意正浓    时间: 2006-03-29 10:18
这个要支持。
作者: jxgcyzdh    时间: 2006-03-29 10:50
支持LZ
作者: stone232_cn    时间: 2006-03-29 10:50
标题: 鼓励,大大地鼓励!!!
你太辛苦了,谢谢了
作者: lwlava    时间: 2006-03-29 15:17
支持
作者: sugo    时间: 2006-03-29 15:54
支持,希望最后出现一个总结的版本
作者: gaoxintian    时间: 2006-03-29 15:56
第二章讲到了很多和以前版本不同的东西,翻译起来比较累
今天就先到这儿
作者: lostit    时间: 2006-03-29 16:32
绝对支持
作者: fzm    时间: 2006-03-29 16:40
不错,再次鼓励。
作者: 梦回唐朝888    时间: 2006-03-30 08:48
在翻译的过程中如果能加入一些自己的理解,我觉得会更好。支持!!
作者: gaoxintian    时间: 2006-03-31 15:32
标题: 第二章规划与设计(2)
2.3.        HACMP心跳
和其他许多类型的集群一样,心跳用来检测网络接口,通信设备,IP标签(服务的,非服务的,永久性的IP)以及节点本身的可用性。
从HACMP V5.1开始,心跳是专有的,基于RSCT拓扑的服务(这样,HACMP V5.1仅有的增强的可扩展性,经典的通过网络模块的心跳,直接被集群管理后台控制)心跳是通过集群中每两个节点间的每个通信设备传递和交换的信息(保活数据包)。每一个集群中的节点定时的间隔发送心跳信号到其他节点,并且预期的接受心跳信号从相应的节点。如果接受的信号中断了,RSCT认可这一个错误并告诉HACMP,HACMP将执行合适的恢复动作。
心跳信息可以通过两种网络传送:
        TCP/IP网络
        点到点非IP网络
为了避免HACMP集群的分离,HACMP必须能区分节点故障和TCP/IP网络故障。TCP/IP网络可以因为不完美的网络元素(交换机,集线器和电缆等)而发生故障,当这种情况发生时,集群中的节点不能通过IP发送心跳信号,所以每个节点考虑到对方节点故障而都去尝试获得资源,这将导致一个潜在数据问题,特别是使用了并发的资源组时。
非IP网络是在两个节点间直接的点对点连接,不再使用IP进行心跳信号的交换,也因此减少了IP网络的故障带来的问题。假如这样的网络类型使用了,那么当IP网络故障时,节点仍然可以交换信息,可以判定网络故障而不会发生资源组的接管操作。
为了避免HACMP被分开,我们推荐配置冗余的网络(IP网络和非IP网络),同时使用这两种网络。建议使用的两个节点的群集参见Figure 2-3。

2.3.1.        通过磁盘的心跳信号
通过磁盘的心跳是HACMP V5.1的新特性,提供了对防止集群分割和单个非IP网络的附加的保护,特别是当RS-232和tmssa、tmscsi等连接太复杂或无法实现时。
这种类型的网络可以使用许多类型的共享磁盘存储(光纤通道,SSA和SCSI等),磁盘用来交换KA信息的一段只是作为AIX增强并发卷组的一部分,它不是排外性的仅作为这个目的使用,它们仍然可以用来存贮应用共享的数据。
客户需要使用目标模式的光纤通道连接,但是对于异构的FC环境(adapter,存储子系统,SAN交换机),这将很难实施和支持。
使用共享磁盘来交换信息是更可靠的非IP网络,并且不依赖于特定的硬件。此外,在一个SAN环境中,当使用光纤连接设备,非IP网络的光纤的长度仅仅是SAN的限制,因此允许非常长的点对点的网络。
当定义一个磁盘作为增强的并发卷组,这个磁盘的一部分(一部分扇区)将不能给lvm使用,将用来在两个节点间交换信息。
使用基于磁盘的心跳的详细说明如下:
        一个磁盘可以用来做两个节点间的一个网络,这个磁盘在两个节点上使用相同的唯一的特定的标识的PVID。
        推荐在一个存储范围内的一对节点间(或者一个磁盘柜)的一个磁盘配置磁盘心跳网络。
        该磁盘需要是增强并发卷组的一部分,虽然并不要求卷组激活或者是资源组的一部分。仅仅的限制是VG必须同时定义在两个节点上。
注意:集群中并发卷组的锁机制不再需要保留磁盘的一部分来通信,而是以RSCT组服务替代。
2.3.2.        通过IP别名的心跳
对于IP网络,引入了一个新的心跳机制:通过IP别名的心跳。这使得集群不再需要或者可能再改变通信接口基本IP地址。
在IP别名上的心跳信号是配置在当HACMP服务启动时已经存在的IP地址上的。用来做这个的IP地址子网必须和已存在的每一个IP子网都不相同,并且不被定义在(/etc/hosts,BIND等)名称解析中。这样的配置不需要一个附加的可路由的子网。
作为基础和引导IP地址交换心跳信息的替代,RSCT使用HACMP定义的IP别名去完成每一个通信接口的通信组(心跳环)。
注意:当使用了IP别名的心跳,基本/引导IP地址不再被RSCT拓扑服务监控,将通过分配的IP别名去监控这些通信接口。
虽然有这些技术,HACMP仍然需要所有接口可以和其他接口通信(可以看到节点的每一个MAC地址)。IP别名使用的子网掩码和服务IP之一的掩码一致。当定义用来做心跳的IP地址时,你必须保证有足够的子网可用并不会冲突。例如:在三个网卡每节点的三节点集群中,你需要三个非路由的子网。参考图2-4和2-5。
假定每一个节点有三个网卡(en0,en1,en2),网络掩码是255.255.255.0,那么分配给每一个接口的别名如下表:
adapter/node                node1                        node2                        node3
en0                        172.16.100.1        172.16.100.2        172.16.100.3
en1                        172.16.101.1        172.16.101.2        172.16.101.3
en2                        172.16.102.1        172.16.102.2        172.16.102.3


通过IP别名实现得心跳的IP地址在集群同步时存储在HACMP adapter ODM库中。
在HACMP V5.1中,IP别名的心跳可以配置在建立基于IP的心跳环,使用任何一种IPAT的类型(IP别名和IP重置)。IPAT配置的类型探测HACMP是怎样操作服务IP地址/标签的:
        IPAT via IP重置服务标签在base/boot地址上,没有心跳的别名。
        IPAT via IP别名的服务IP地址作为别名和基本IP一起在通信接口上,并且使用别名心跳。
IP别名的心跳定义为HACMP的一个网络特性并且作为HACMP拓扑的一部分。要使用这个工具,用户必须在HACMP的网络定义中指定起始的地址。
要设置这个属性,你必须使用扩展的smit菜单(clustertopology)。这可以在定义网络时定义,也可以在稍后改变这个配置。
2.4.        共享存储的配置
大部分的HACMP配置需要共享的存储。IBM支持的多种主机存取磁盘子系统包括SCSI,SSA,ESS,FastT。
也有许多第三方的存储设备可以使用,虽然许多没有IBM的认证,请参考制造商的web。
HACMP支持的IBM存储设备的列表,包括ESS,SSA等,也支持磁带设备的存储,不支持磁带的并发。如下:
        IBM 7133 SSA Disk Subsystem Models D40 and T40 (up to 72.8 GB disk modules, andup to eight nodes per SSA loop)。
        IBM Enterprise Storage Server (ESS) Models E10, E20, F10, and F20 (supports up to eight nodes using SCSI and Fibre Channel interfaces via IBM FC/FICON, Feature Code: 3021, 3022, and 3023)。
        IBM 7133 SSA Disk Subsystem Models D40 and T40 (up to 72.8 GB disk modules, and up to eight nodes per SSA loop)。
        IBM Total Storage FAStT 200, 500, 600, 700, and 900 models。
HACMP同样支持共享的磁带设备(SCSI或者FC),但是磁带设备不支持并发访问。如下:
        IBM 3583 Ultrium Scalable Tape Library Model L18, L32 and L72
        IBM 3584 Ultra™ Scalable Tape Library Model L32 and D32
        IBM Total Storage Enterprise Tape Drive 3590 Model H11
        IBM Magstar® 3590 Tape Drive Model E11 and B11
        IBM 3581 Ultrium Tape Autoloader Model H17 and L17
        IBM 3580 Ultrium Tape Drive Model H11 and L11
更多的产品支持信息请登陆网站:
http://www-1.ibm.com/servers/eserver/pseries/ha
HACMP同样支持其他非IBM的存储(磁盘、磁带)子系统,相关信息请登陆网站:
http://www.availant.com/
2.4.1.        共享LVM的需求
为HACMP规划共享的LVM依赖于共享磁盘存取的方法和设备的类型。共享LVM需要考虑这些元素:
        数据保护的方法
        存储存取的方法
        存储硬件的冗余
注意:HACMP本身不支持存储的保护,存储的保护通过AIX的LVM镜像和硬件RAID的实现。
在这一节中,我们提供了在存储层保护数据的方法,也讨论了LVM共享磁盘存取的模式。
        非并发的
        并发的(clvm——HACMP的并发逻辑卷管理)
        增强并发模式(ECM,AIX V5.1以后新特性
2.4.2.        非并发的,并发的和增强并发的
在非并发存取的配置下,在同一时间只有一个节点可以存取共享的存储。如果一个包含共享磁盘空间的资源组移动到另一个节点,那么新的节点会激活磁盘,并检查卷组,逻辑卷和文件系统的当前状态。
在非并发的模式下,磁盘可以配置共享为:
        裸物理卷
        裸逻辑卷
        文件系统
在并发存取模式下,存储在磁盘上的数据同时对所有的节点可用。这种模式不支持文件系统(不管是JFS还是JFS2)。
快速磁盘切换
在HACMP V5.1中,开发使用了一个新的AIX增强的并发LVM。在AIX 5L V5.2中,必须使用增强并发模式去创建新的并发卷组;增强并发的卷组也可以使用文件系统(共享的和非共享的)。当发生故障切换的状态时。这可以使快速磁盘切换选项加速共享文件系统的切换。
增强的并发卷组在资源组中的所有节点下被激活,HACMP去调整数据的存取控制。仅仅在激活资源组的节点上卷组激活在"并发的激活状态"模式,其他节点将卷组激活在"被动"模式。在被动模式时,在卷组上不允许有高级的操作。
注意:当使用了资源组的快速磁盘切换选项,非常重要的就是要有冗余的网络和非IP网络。这可以消除和避免数据的不一致性。
RAID和SSA并发模式
RAID并发模式的卷组是陈旧的定义,因为增强并发卷组模式提供了附加的能力,但是RAID并发卷组将继续被支持一段时间。RAID和SSA并发卷组在HACMP V5.1中都被支持但有一些重要的限制:
        并发资源组的增强卷组需要运行64位内核的节点支持
        SSA的并发模式不支持64位的内核
        SSA磁盘在32位内核模式仍然可以使用SSA并发模式。
        C-SPOC单元不能支持RAID并发卷组。你不得不转换这些卷组到增强并发模式(否则,AIX视为非并发的卷组)
        在AIX V5.1中,可能创建一个SSA并发卷组(32位),但在5.2中,不可能创建一个并发的HACMP,所有的新的卷组必须使用增强并发模式
LVM需求

这里叙述了lvm管理的概念。
强迫激活卷组
HACMP5。1提供了新的工具,去强制激活节点上的卷组。如果在故障切换的进程中,正常的varyon命令不能激活卷组(lackofquorum),HACMP将确保在接管节点激活卷组前至少每一个Lv有一个有效的LPcopy是可用的。
强迫性的激活卷组可以让你一直保持资源组中卷组的在线状态并且有一个有效的数据copy。你仅仅可以在卷组包含镜像的逻辑卷时使用这个选项。还要小心的注意到避免创建一个分开的集群。
注意:你必须指定一个非常严格的lv分配策略来使用这个强制激活的选项。在这种方法下,LVM确定lv的copy总是在分开的磁盘上,可以增加失效时强制激活的成功概率。
这个选项当一个vg的vgda丢失时的接管是很有用的。如果没有使用这个选项,资源组将不能在接管的节点上激活,因而导致应用的不可用。
当使用了强制激活选项发生接管时,HACMP首先尝试正常的varyonvg。如果尝试因缺少quorum失效,HACMP在尝试强制卷组在线时首先检查数据的完整性-确定所有数据在卷组中都至少有一个可用的copy。如果是这样,他执行varyonvg-f,如果不能,卷组仍然离线并且资源组有一个错误的报告。

[ 本帖最后由 gaoxintian 于 2006-3-31 15:37 编辑 ]

2-3.JPG (30.56 KB, 下载次数: 102)

2-3.JPG

2-4.JPG (26.98 KB, 下载次数: 101)

2-4.JPG

2-5.JPG (23.06 KB, 下载次数: 93)

2-5.JPG

作者: gaoxintian    时间: 2006-03-31 15:40
2.4.3.        选择磁盘的拓扑
HACMP5。1支持下列存储的拓扑:scsi,ssa和光纤通道(TastT和ESS磁盘子系统)。完整支持的外部存储的列表可以在ibm网站找到。
HACMP支持下列的ibm磁盘技术在HACMP中作为外部共享磁盘使用。
IBM2105企业存储服务器
ibm2105企业存储服务器提供并发的连接和磁盘存储共享在多种开放的系统平台上。除了ibm的p系列服务器机器,许多其他的平台也被支持。
由于共享存储环境得多平台得支持,为了避免冲突,非常重要得就是配置适当得LUN标记和zone配置来提供安全得数据存取。ESS使用ibm得ssa磁盘技术。ESS提供了内建的可用性和数据保护。RAID技术用来保护数据,同时,磁盘有故障前期分析特性预测将会出现故障。使数据保持可用。ESS事实上有所有的组件冗余避免内部组件损坏而导致故障,从而提供了保护。ess管理两个节点的集群通过内部的高速总线连接到内部的存储(ssa磁盘),每个节点上有精确等同的定义。因此,当内部节点失效,存储对系统仍然有效(可用性)。
更多的信息参考ibm网站。
一个典型的使用ESS的HACMP集群的例子如图2-6。

ibmFastT700和900中等存储服务器
IBMFatsT900和700存储服务器传输超越磁盘性能和突出的可靠性来为苛刻的应用程序提供良好的计算环境。
IBMFatsT系列存储子系统是提供好的可测量的,高性能的和数据保护的中等解决方案。在FatsT架构中,虽然不是作为久经考验的ESS实现,仍然提供基于冗余组件(存储控制器,电源支持和存储连接器)的可靠性。
FastT700和900架构实现了在主机和存储端的本地的光纤通道协议。他不再支持scsi,并且不专注于提供两个控制器之间的高速度,但是提供了控制器的无间断的错误切换和主机端的数据缓存。
需要完整的信息关于ibm的存储解决方案,请访问ibm的网站。
典型的FatsT连接的HACMP如图2-7。

IBM串行存储架构磁盘子系统
SSA存储架构提供一个更离散组件的解决方案,提供了减少单点故障的特性。
SSA存储在HACMP环境通过冗余硬件提供了高可用的和电源,磁盘热切换的特性(在线维护)。
SSA存储也提供了RAID在hba(hostbusadapter)层。
注意:如果使用ssa的raid特性,那么HACMP只能连接两个节点。
ibm的7133子系统能在HACMP中提供并发存取的配置。请参阅7133相关配置。如图2-8。

2.5.        软件规划
在HACMP规划的进程中,很重要的一步就是选择集群节点中软件运行的层次。
节点软件规划的考虑因素有:
        操作系统需求:AIX版本和推荐层次。
        应用的兼容性:确保应用的所有需求适合并且在HACMP环境中支持。
        资源:使用资源的类型(IP地址,存储配置、必要的话还有NFS等)。
2.5.1.        AIX级别和相关的需求
在安装HACMP之前,你必须操作系统的需求级别。本红皮书书写时的推荐层次如下表:
HACMP Version        AIX OS Level        AIX APARs        RSCT Level
HACMP V5.1        5100-05        IY50579,IY48331        2.2.1.30或更高
HACMP V5.1        5200-02        IY48180,IY44290        2.3.1.0或更高
HACMP V5.2        5100-06        IY54018,IY53707,
IY54140,IY55017        2.2.1.30或更高
HACMP V5.2        5200-03        IY56213        2.3.3.0或更高
有关HACMP V5.1和V5.2的推荐维护级别的最新的信息请访问IBM网站:
http://www-912.ibm.com/eserver/support/fixes/fcgui.jsp
注意:
        要在VPATH磁盘中使用C-SPOC,需要设备驱动子系统(SDD)1.3.1.3或更高版本。
        要使用HACMP在线规划工作表,AIX 5L的Java运行环境版本必须高于1.3.1,同时要有图形显示器(本地或远程)。
        HACMP V5.1和V5.2支持在AIX 5L V5.2下访问磁盘系统的多路I/O设备驱动(MPIO)。
下列基本操作系统(BOS)组件需要在HACMP之前安装:
        bos.adt.lib
        bos.adt.libm
        bos.adt.syscalls
        bos.net.tcp.client
        bos.net.tcp.server
        bos.rte.SRC
        bos.rte.libc
        bos.rte.libcfg
        bos.rte.libcur
        bos.rte.libpathreads
        bos.rte.odm
        bos.data
当使用增强并发资源管理时,还需要下列组件:
        bos.rte.lvm.5.1.0.25或更高(在AIX 5L V5.1下)
        bos.clvm.enh
完整推荐维护级别的列表,请参考IBM网站:
http://www-912.ibm.com/eserver/support/fixes/fcgui.jsp
2.5.2.        应用兼容性
HACMP是可伸缩的高可用的解决方案,事实上可以通过在独立的AIX节点上使用HACMP群集运行应用以保护应用。
当开始一个应用的规划时,需要考虑下面的方面:
        应用在AIX系统的版本上的兼容性。
        应用在实现高可用的存储方法上的兼容性
        你必须知道所有应用和平台相互依赖的东西,也就是说应用程序所有的文件分布(永久性数据、临时文件、套接字、可能的话还有管道)。
        你必须提供一个无人值守的应用启动和停止的脚本。并且应用可以在重新启动时从错误中(例如:节点应用崩溃)恢复。
重要提示:不要加入在独立节点上就不能正确执行的应用或者你不能确定应用依赖的文件等!!!
        如果你计划使用应用的监控,你应该提供应用的监控工具(方法,行为和脚本)。
        应用客户端的依赖(当服务器重启时客户端的行为)。
        应用网络的依赖(sockets、route等)。
        许可证的问题,如果应用依赖于CPU ID,你应该考虑购买标准的在每个节点上,同时,如果应用基于处理器个数,那么要确定,当错误切换时,许可证不被破坏。
应用服务器
依照HACMP的定义,一个应用服务器是HACMP当激活资源组时启动应用和资源组离线时停止应用的脚本的集合。一旦应用启动,HACMP能监视应用,并且当应用运行不正确时执行动作。应用监控可以在进程级,也可以使用定制的方法(例如,一个多处理的进程数据库引擎等)执行。
注意:应用监控在HACMP/ES 4.4中引入,是基于RSCT事件管理的定义。从HACMP 5.2开始,事件管理被资源监控控制器(RMC)替代,两者功能相同,但是RMC提供了更多的弹性。从HACMP 5.2开始,同样可能去监控应用的启动。
HACMP也提供了应用可用的分析工具,可以用来审计所有的应用可用性,评估集群的环境。
需要应用服务器和其他资源的信息,请参考3.5 资源组配置。
2.5.3.        规划NFS配置
HACMP的一个典型的应用就是对客户机和应用服务提供高可用的HA-NFS。这是很有用的,特别是集群运行一个相互接管的交叉挂接的NFS。从HACMP 4.4开始,HA-NFS已经整合到HACMP中,不再是一个单独的产品。
使用NFS的一些注意事项:
        对于要输出为NFS的共享卷组来说,卷组的Major Number在所有服务文件系统的vg的所有集群节点上是一样的。
        在AIX中,当你使用mknfsexp命令输出文件系统和目录时,/etc/exports文件将被创建和更新。也就是说,在HACMP中,输出为NFS的文件系统和目录必须在资源组配置中指定。
        如果你需要这些文件系统的一些可选配置项,那么你就需要创建/usr/es/sbin/cluster/etc/exports文件。
        对于所有输出文件系统的资源组来说,"File system mounted before IP address configured"属性必须置为"true"。
        HACMP的脚本包括缺省的NFS行为。你需要去改变这些脚本去适合你的配置。
        在HACMP 5.1中,在附加的层叠(cascading)资源组中你可以在rotating和定制资源组中配置高可用的NFS。
注意:NFS锁定功能限制为两个节点的群集,这个功能提供了当主NFS服务失效时允许备份的进程去恢复当前的NFS行为,保留NFS文件系统的锁定和副本缓存(dupcache)。
2.5.4.        许可
许多的软件供应商需要你的每一个应用在每一台物理机器上或者在SMP机器上每个CPU有唯一的许可证。通常,许可证激活码在软件安装时输入。然而,在HACMP环境中的切换状态,如果应用在另一个节点重新启动,你必须确定你在新的机器有必须的激活码;否则,应用不能正确的启动。
应用也可能有唯一的节点绑定的许可证(每一个机器上有不同的许可证文件)。
一些应用限制限制集群中漂移的应用的许可证的数量。要避免这个问题,你需要有足够的许可证,这些应用可以同时在多个节点上执行,特别是在并发的应用中。
2.5.5.        客户端连接
当资源组切换时,应用在另一个节点上启动,应用必须知道这个动作。在某些情况下,应用客户端使用本机ARP缓存去重新连接服务器。在这种情况下,有两种可能的结果:
        持有服务IP的网络使用通过IP置换得IPAT实现了本地MAC地址的切换(因此,客户端机器ARP缓存没有被更新)。
        当网络或节点事件发生时HACMP使用clinfo程序调用/usr/es/sbin/cluster/etc/clinfo.rc脚本。缺省的,这个动作更新系统的ARP缓存并且指定客户端的ARP缓存反应网络的改变。你可以定制这个脚本以进一步满足需求。
clients运行clinfo后台守护进程能在集群事件后快速的连接到集群。
注意:如果你使用IPAT via IP别名,确保你的客户端支持支持ARP刷新功能。
如果HACMP节点客户端在同一个子网上,客户端不需要运行clinfo,你可以间接的在集群节点上通过ping客户端来刷新客户端的ARP缓存。
你可以在集群节点上通过添加你想要通知的客户端的IPlabel和地址到clinfo。rc脚本中的PING_CLIENT_LIST变量。一旦集群事件发生,这个脚本就会运行下面的命令到PING_CLIENT_LIST中的每一个主机:
#ping -cl $host
当client在不同的子网时,确保路由器的ARP缓存在发生IPAT事件时得到更新;否则,客户端在重连时会有预期的延迟。
2.6.        操作系统空间需求
在HACMP 5.1中,包括集群校验程序(clverify)和新的集群通信后台(clcomdES)都需要/var文件系统下附加的空间。
要得到详细的消息和附加的调试信息,在每个节点的/var下需要满足:
        20M仅一次,包括:
-        /var/HACMP/clcomd/clcomd.log  2M
-        /var/HACMP/clcomd/clcomddiag.log  18M
        在/var/HACMP/odmcache目录下附加的(1M*集群中的节点数)空间。
        4M每个节点集群的效验数据。
        2M的集群效验log(clverify.log[0-9])。
在集群的每个节点中,效验工具在需要/var下4M的空间,clverify可以在同一时间最多保持四份节点效验数据的拷贝(节点初始化和同步时)。
/var/HACMP/clverify/current/<nodename>/*包含当前执行的效验的日志。
/var/HACMP/clverify/pass/<nodename>/*包含最后通过的效验的日志。
/var/HACMP/clverify/pass。prev/<nodename> /*包含倒数第二次通过效验的日志。
/var/HACMP/clverify/fail/<nodename>/*包含最后一次失败的效验日志。
同时,/var/HACMP/clverify/clverify.log和它的拷贝消耗1-2M的磁盘空间。
2.7.        资源组的规划
资源组是一个包含HACMP执行高可用的资源的一个逻辑实体。资源包括:
        存储空间(应用程序的代码和数据)
-        文件系统
-        网络文件系统
-        裸逻辑卷
-        裸物理磁盘
        服务IP地址/标签(客户端连接应用时使用)
        应用服务器
-        应用启动的脚本
-        应用停止的脚本
要通过HACMP实现高可用,每一个资源都必须包含在资源组中。
HACMP在集群事件发生改变时通过在节点间移动资源组来确保集群资源的可用性。HACMP在下列状态时控制资源组的行为:
        集群启动
        节点失效
        节点重组
        集群关闭
在上述的群集下,HACMP的资源组的行为定义在:
        当节点(一个或者几个节点)在集群启动时需要获取资源组;
        当拥有资源的节点失效时接管节点接管资源组时;
        不管资源组恢复到刚刚发生故障而恢复的节点,还是当前拥有的节点。
集群中的节点优先级关系决定了哪一个节点最初控制资源组并且当一个最初的节点在失效后重新加入集群接管对资源组的控制。
资源组接管关系定义为:
        层叠式
        轮转式
        并发式
        定制式
层叠的,轮转的和并发的资源组是在HACMP 5.1以前的类型。因为定义这些类型的难于理解,在HACMP V5.1中引进了新的定制资源组。
这里仅仅有一个常化HACMP术语和让HACMP的概念容易理解的步骤。从HACMP V5.2开始,仅仅有定制资源组存在。
2.7.1.        层叠式资源组
层叠式资源组定义了一个所有可以控制资源组的节点列表并且每一个节点有一个托管资源组的优先级。
一个层叠式资源组的行为如下:
        在集群启动时,层叠式资源组在缺省的节点上激活(资源组的最高优先级的节点上)。
同时,另一个称为“非活动的接管”属性的可以用来指定如果高优先级的节点在集群启动时不可用的时候在低优先级的节点上激活。
        当一个节点失效时,一个层叠式资源组在资源组优先级列表中的下一个节点上激活。
同时,可以指定"动态节点优先级"失效切换的进程将根据动态的属性(高cpu空闲等)确定接管资源组的节点。
        当失效节点重新接入集群,层叠式资源组将重新切换到缺省的节点上。
附加的,可以指定"层叠不需要回退",资源组将依然保持在接管节点上即使一个高优先级的节点重新接入集群。
总结一下,层叠式资源组有下面的属性:
        非活动性接管允许你精妙的定义主节点不可用时对资源组的接管;
        当拥有资源组的节点失效时,该资源组可以根据节点优先级列表切换到下一个可用的结点。节点优先级列表可以通过两种方法配置:使用默认(RG配置时的节点列表)或者设置一个动态节点优先级(DNP)策略。
        无后退层叠(CWOF)属性改变了切换行为,使用CWOF属性可以避免高优先级节点恢复可用时不必要的RG切换(由客户中断引起的)。在这种模式下,可以在不影响客户的时间手动将RG移动到它的主节点上。
2.7.2.        轮转式资源组
对于一个轮转式资源组来说,节点的优先级列表仅仅用来决定哪一个节点来接管失效的节点。
在集群启动时,在节点优先级列表中第一个可用的节点将激活资源组;一旦在一个接管的节点上激活,它不会切换回高优先级的节点即使高优先级节点重新可用;在轮转时资源组中不使用DNP(动态的节点优先级);当在同一个节点上配置多个轮转的资源组时,为了控制首选的资源组的定位,每一组都要从节点群中分配一个不同的高优先级节点。当集群启动时,每一个节点将尝试去获取它自己具有高优先级的资源组;如果所有的轮转资源组已启动,新节点的加入仅能作为这些资源组的后备节点;如果所有的资源组都没有激活,新加入的节点将仅仅去获得这些资源组的一个,其他的资源组仍然保持非激活状态。
无论如何,如果存在多个网络可供资源组移动,一个节点可能获得多个资源组,每一个网络上只能有一个。
2.7.3.        并发的资源组
和名称一样,一个并发的资源组可以在多个节点上同时激活,当集群启动时,资源组将在列表的所有节点上激活,没有顺序。
对并发资源组来说,没有节点间的优先级,他们是平等的节点,如果一个节点失效,其他的节点仍然一样提供服务,资源组不能被移出。
管理并发的存取应用的数据可能需要附加的并发软件。
2.7.4.        定制资源组
为了简化资源组的管理和理解,HACMP V5.1引入了定制资源组的类型。资源组指定的名称可能会使新的用户(层叠,轮转和并发)混淆:
        他们不能清晰的指出潜在的资源组的行为。
        附加的资源组参数将进一步使定义资源组变得复杂:无后退层叠和非活动接管
同时,在一些情况下,用户需要组合一些行为,他们不是被标准的RG定义的:
        HACMP V5.1引入了定制的资源组
-        用户必须明确的指定启动的需求,切换和回来的行为。
-        RG启动和切回能通过用户设定和FAllback计时器控制。
-        RG接管也可以通过用户的定义动态节点优先级影响。
        局限性:(仅仅HACMP V5.1)
-        定制资源组仅支持IPAT-via-别名服务IP的标签和地址。
-        没有站点和复制资源(HACMP-XD)支持。
启动参数选择
        Online On Home Node Only:在节点启动时,RG将仅仅使得高优先级的节点在线,这个行为等价于层叠RG行为。
        Online On First Available Node:在节点启动时,RG将在第一个节点上激活,这个行为等价于轮转式RG或者使用非活动的接管的层叠式RG。如果配置了一个设定时间,它将影响RG的这个行为。
        Online On All Available Nodes:RG将在资源组的所有节点上激活。这等价于并发的RG行为。这个启动参数将不考虑某些fall-over和fall-back参数。
切换(fall over)参数选择
        切换至列表中的下一个优先节点:RG将切换到下一个可用的节点上。这个行为等价于层叠式RG和轮转式RG。
        使用DNP切换:RG将基于DNP计算结果去切换,资源组必须指定DNP的优先级。
        使其离线(仅仅在错误的节点上):RG在错误时不发生切换,而是简单的置为离线。这个行为大部分的类似于并发的资源组。
后退(fallback)参数选择
        退回高优先级节点:RG将在一个节点重新可用时切换倒高优先级的节点上。这个行为等价于层叠的资源组的行为。一个fall-back计时器将影响这个行为。
        从不后退:资源组将待在它在的地方,即使一个高优先级的节点重新在线。这个行为类似于轮转式RG的行为。
2.7.5.        应用监控
作为资源组管理的一个附加方面,HACMP能通过下列两种方法监控应用:
        应用的进程监控:探测死进程,使用RSCT事件管理能力。
        应用定制的监控:基于自定义的监控方法(程序或脚本)监视应用的健康状态。
注意:你不能使用应用进程监控一个shell脚本启动的应用,或者应用的进程对应用来说不能反映应用的健康状态的应用。
要监控一个shell脚本的应用,你将不得不定制监控的方法(例如,Apache web server)。
当应用监控是激活状态时,HACMP的行为如下:
        对应用监控进程来说,一个通知集群管理器的内核的钩子监控倒进程已经死掉的话,集群开始应用的恢复进程。
当恢复的动作执行时,你必须提供一个方法清除和重新启动应用(定义的应用起停的脚本可能会用上)。
HACMP在发送警告信息或者移动到另一个节点前会尝试重新启动应用和等待应用稳定一段时间。
        -对于定制应用监控(定制的方法)除了应用清理和重新启动的方法,你还必须提供一个程序或者脚本用来执行一个周期的测试。
规划和配置一个进程的监控需要检查下列方面:
        检查应用是否能被进程监控。
        指定和核查要监控的进程的名称,在配置应用监控时必须强制的使用准确的进程名称。
        指定要监控的应用的实例数(进程的数量)。缺省的值是一个实例。
        指定开始监控等待的时间(秒)。
注意:在很多情况下,这个值不能设为零。例如,在一个数据库应用中,你希望延迟一些监控知道启动脚本和初始化数据库完成。
        重启的计数,表示在执行其他动作时尝试去重启应用的次数。
        间断(秒)。是应用在重新设置重启计数前保持稳定的时间。
        重启计数器归零后应用依然不能运行的时候才去的动作,默认选择是通告,它作为通告集群失效的事件运行;可将选择改为切换,在运行应用的节点失效时将应用和资源组切换至下一个高优先级的节点上。
        如果有需要,还有重启动的方法。(前提是重启计数器不为零)
如果计划安装自定义的监视方法,还应检查:
        是否你有用来检查制定应用的程序或脚本。
        选举间隔(以秒计):监视方法的运行频率。如果监视(进程)在选举间隔内没有响应,应用就会被认为失效,此时恢复进程启动。
        用户自定义的监视(进程)如果在选举间隔内没有返回,即表示该进程应被杀掉。默认的Kill进程信号是SIGKILL。
        开始监视前的等待时间(以秒计)。例如:在一个数据库应用中,推荐监视应在启动脚本和数据库初始化搜索后再运行(换句话说,应用被认为出错后恢复进程才能开始初始化)。
        重启计数器:应用执行其他动作前场是重新启动的次数。
        保持计时器:应用在复位重启计数器前应保持状态的时间。
        应用在重启计数器归零后执行的动作。
2.8.        规划灾难恢复
从HACMP V5.1开始,HAGEO和GeoRM作为IBM HACMP/XD(扩展距离)特性被集成在HACMP中。
HAGEO软件产品为构建灾难冗余的计算机环境提供了一个灵活的、高可用性平台。HAGEO组件可以通过TCP/IP点到点网络不受距离限制的在两个不同的地理站点间进行数据镜像。
HAGEO提供了自动探测、通告和在失效中恢复整个地理站点。
本书中的容灾策略仅讨论在两个站点间进行:原始站点和恢复或者备份站点。数据恢复策略应达到以下结果:
        数据就绪级别:
-        Level 0:没有。容灾中不提供。
-        Level 1:定期备份。需要恢复的数据被备份并发送至另一个地方。
-        Level 2:有准备的前向滚动。作为周期性备份的附加,数据更新日志同样被发送至另一个地方。在恢复站点恢复时只恢复最近记录的数据。
-        Level 3:前向滚动或前向恢复。在恢复站点的磁盘上维护着一份数据的影子拷贝,更新日志会被恢复工具接收到并且将其周期性的应用到影子拷贝中。
-        Level 4:实时前向滚动。和前向滚动一样,源站点记录的更新在同一时间被传输并应用。这里实时的操作不会影响源站点的响应时间。
-        Level 5:实时远程更新。在发送交易响应前源站点和恢复站点的数据拷贝同时被更新。
        站点互联选项
-        Level 0:没有。在站点间或数据传输。
-        Level 1:手动传输。不提供互联,需要传输的数据被手动发送至另一个地方。
-        Level 2:远程磁带。数据通过远程磁带进行电子传输。急件和收据是自动的,跟踪既可以设为自动,也可以手动。
-        Level 3:远程磁盘。数据通过远程磁盘进行电子传输。急件、收据和跟踪都是自动的。
        恢复站点就绪
-        冷站点:通常冷站点是指在正确的架构下,极少或没有数据处理设备的环境。该设备被作为恢复进程的第一步来安装。灾难发生时、周期性备份和有准备的前向滚动都可以将这个站点存储的数据装走。
-        温暖站点:它有数据处理设备安装和操作,这个设备被用来处理在灾难发生时其他的数据进程任务。数据处理资源可以用来存储数据,例如日志等。此站点的恢复(进程)经常做关闭和备份的工作。周期性备份和有准备的前向滚动数据都可以在该站点存储以便在灾难中快速恢复。
-        热站点:有数据处理设备安装和操作,包括频繁或有规律的存储以减少恢复时间。在前向滚动和实时远程更新中可以实现所有级别。
HAGEO软件提供更高级别的灾难恢复:
                Level 5;
        Level 3;
        热站点就绪。
此外,在HAGEO中,恢复站点同样可以活动的进行数据处理和执行日常工作。实际上,每个站点都是其他站点的备份,因此它最小化了安装成本。
HACMP对容灾的贡献
HACMP基本软件提供了一个宽松的群集环境来防止在群集中个别系统组件(像处理器、网络、网络适配器)的SPOF。它确保了在一个站点内的计算机环境下的高可用性。
现在你已经可以定义HACMP群集组件在一个站点内的系统组件和通过HACMP基本软件功能保持在该站点中的系统组件的高可用性。更多信息请参考HAGEO拓扑下的HACMP/XD:规划管理指南——SA22-7956。
图2-9表示一个使用远程镜像(GeoRM)选项的地理集群。

[ 本帖最后由 gaoxintian 于 2006-3-31 15:41 编辑 ]

2-6.JPG (19.99 KB, 下载次数: 99)

2-6.JPG

2-7.JPG (22.24 KB, 下载次数: 95)

2-7.JPG

2-8.JPG (21.08 KB, 下载次数: 101)

2-8.JPG

2-9.JPG (46.74 KB, 下载次数: 110)

2-9.JPG

作者: zkc_lz_gs    时间: 2006-03-31 17:37
顶,老大,一个字猛!
作者: gaoxintian    时间: 2006-04-01 15:56
为方便插图和阅读,后续文章将贴在我的博客中
http://gaoxintian.cublog.cn
作者: myuhan    时间: 2006-04-01 18:38
鼓励一下
作者: subicman    时间: 2006-04-02 00:11
标题: 楼主的精神可嘉
鼓励,顶一个!
作者: frankven    时间: 2006-04-02 22:11
不是没人来顶,而是对你这项工作了解的人不多,小弟我在此先多谢了,很希望能尽早看到完整版的翻译,^&^
作者: lj_cd    时间: 2006-04-03 09:37
加油,兄弟
作者: RS9000    时间: 2006-04-03 09:39
一个人力量太小了。。我决定主意不错,能不能大家一起翻译呢。。每个人分一点,这样是不是更好呀!
作者: jackwork_80    时间: 2006-04-03 11:05
好东西,加油,支持哥们
作者: jtw    时间: 2006-04-03 15:33
有什么好翻译的,更新那么快,根本没必要。

现在已经用HACMP 5.3
作者: tianshezi    时间: 2006-04-03 16:51
jtw先生不要说这样让人泄气的话,虽然更新的快,翻译出来掌握了不是基础吗?万变不离其宗没有听说过吗?

楼主,支持你!!!!
作者: unixboy1106    时间: 2006-04-03 18:08
鼓励,期待LZ早日完工。
作者: 圣龙骑士    时间: 2006-04-04 09:45
不错,对新手很有帮助,支持
作者: yy_lee8888    时间: 2006-04-04 09:58
强烈强烈的支持!!!
作者: flyabout    时间: 2006-04-04 13:40
鼓励一下.
作者: todd    时间: 2006-05-10 13:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: jaffas    时间: 2006-05-11 10:44
顶啦!好东西呀!
作者: neusoftsun    时间: 2006-05-11 13:12
支持!!!!
作者: yanqinfeng    时间: 2006-05-12 15:22
支持
作者: syn1980    时间: 2006-05-17 16:02
楼主厉害啊,非常支持哦
作者: spender    时间: 2006-05-17 21:47
好佩服哦! 不着急,慢慢翻译,然后出本 pdf 资料,我们都来看。不要忘了到时候发给我一份: spender@scrcu.com.cn
作者: starmoon2003    时间: 2006-05-17 22:05
标题: 加油
兄弟顶一下。
作者: gaoxintian    时间: 2006-05-18 08:47
更多的章节在我的博客上有:
http://gaoxintian.cublog.cn
作者: p2punix    时间: 2006-05-18 10:00
大力支持, 楼主加油干!!!!!!!!!!!!!!!!!!!!!!!!
作者: yifanguo    时间: 2006-05-19 10:02
天哪,我也在慢慢翻译呢……
加油!
作者: 龙牙草    时间: 2006-05-20 09:51
标题: 支持
支持!希早日看到你的书
作者: ncjh    时间: 2006-06-09 10:51
标题: 感谢
正在学习hacmp呢
作者: tkzd    时间: 2006-06-09 11:10
加油啊
作者: zhoujianbo    时间: 2006-06-11 10:37
看你的BLOG网站就可以了
作者: mjxyx    时间: 2006-06-22 23:19
标题: 支持
顶,一加一两个字呀"够牛"!
作者: fyp-0923    时间: 2006-07-19 22:05
辛苦了,如果能出本翻译的书就更好了
作者: chinahdx    时间: 2006-07-20 17:05
你是一片苦心,从我想获得知识的层面来说,我也希望你这样做!
    但我觉得似乎不太好,第一是会花掉你很多的时间,让你和家里的沟通更加少。第二是6K的工程师都有一定的英文能力,如果英文不太好,看英文可以提高他们的能力,这样印象也会更加深,而更多的是去实践。毕竟小机里接触到的资料都是英文的。还有其它的原因,我就不一一多说了!
     我说的是我的理解,希望大家也想一想,而不是给我劈头盖脸的一顿骂!
作者: yghuzi    时间: 2006-07-21 12:55
我费很大力气顶LZ
作者: naotan    时间: 2006-07-21 16:33
楼主真是个好人啊!顶!
作者: wgj    时间: 2006-07-21 16:46
绝对的鼓励~
作者: cceeoo    时间: 2006-07-21 16:46
楼主加油
作者: Alex_Feng    时间: 2006-07-24 14:54
支持!!
作者: flyingbrick    时间: 2006-07-24 20:00
跪鼓!
作者: lxjweb    时间: 2006-07-25 13:38
鼓励!
作者: liqing_0    时间: 2006-07-25 14:30
鼓励,好人。
作者: wangying1518    时间: 2006-07-26 13:18
强烈鄙视JTW ..............

强烈支持楼主!!!!!!!!!!!!
作者: shmdhcxy    时间: 2006-11-13 19:43
我先支持下楼主,呵呵。
作者: wwszadu    时间: 2006-11-14 11:30
支持
作者: shanlangking    时间: 2006-11-14 16:50
楼主辛苦了,不容易啊
作者: penguinstorm    时间: 2006-11-15 16:44
不赞成这样翻译,一是浪费时间,二是没有必要
作者: xiaobudian    时间: 2006-11-16 07:19
翻译主要是帮助大家理解,其实还是要以英文版为主啊。楼主辛苦,要不要帮忙?
作者: Jackychen83    时间: 2006-11-16 10:18
标题: 支持楼主
强烈支持 楼主是我们的福音啊
作者: zhaiph    时间: 2006-12-25 16:45
楼主辛苦 支持 加油 鼓励下  
作者: dingyangkui    时间: 2007-05-28 09:49
有没有hacmp5.3 的详细配置文档
作者: ssafa    时间: 2007-05-28 09:56
支持,希望楼主好好干
作者: hbm8888    时间: 2007-06-05 15:17
顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶
作者: chinaunix1688    时间: 2007-06-05 16:08
支持,希望成为精华
作者: zouzhi021    时间: 2007-06-06 22:57
支持!
作者: ls801117    时间: 2007-07-05 08:44
坚决支持lz
作者: machonghao    时间: 2007-07-27 12:20
支持
作者: jiukai    时间: 2007-07-27 17:19
强烈支持!
作者: skyping    时间: 2007-08-23 15:03
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2