免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1527 | 回复: 0
打印 上一主题 下一主题

[HACMP集群] hacmp教程 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-04-07 15:35 |只看该作者 |倒序浏览

第一章     HACMP的概念和原理
在今天竞争激烈的全球市场中,从金融、电信、医疗到零售、运输、制造的各个企业都必须保证关键性业务的信息和数据的可用性,而且通常是一天24小时,一年365天。各个企业必须始终如一地、正确地根据用户的要求提供银行往来金额、投资资金、医疗记录、测试结果和其它许多关键服务,而成功提供这些服务的关键是依靠信息技术的可用性。
由Contingency
Planning Research提供的最新研究结果表明,平均每小时的宕机时间会导致上百万美元的损失。更重要的是,当因为意料之外的系统故障而丢失他们的数据之后,50%的公司没有再重新开门,90%的公司则歇业两年。
因此,要保证业务的连续性,就必须尽可能减少会导致信息和应用不可用的系统宕机时间,从而减小对用户服务的影响。关键业务的连续性可以通过以下三个层次的方法实现:
磁带备份
磁带备份是实现基本的业务连续的通用方
法。信息先备份到磁带上,然后送到另外的地点保存。这种方法的问题在于磁带备份往往需要较长的时间来记录数据。另外,在数据备份过程中或者做数据备份前的
系统或环境故障很可能造成数据丢失。而且,从备份磁带上恢复数据也需要很长的时间,数据存储得越多,恢复的时间越长。
高可用系统
高可用系统一般是在一个地点,通过高可用软件将一组服务器连接在一起,组成一个群集。IBM的HACMP for AIX和HP的MC/ServiceGuard就是这样的群集产品,通过快速地将用户、应用和数据从发生硬件或软件故障的机器切换至其它机器来提供高可用计算环境。
容错系统
容错系统依赖于冗余的硬件设备和软件来实现关键业务的连续性。虽然容错系统是避免宕机和数据丢失的有效方法,但是购买、操作和维护容错系统都是非常昂贵的。另外,系统的升级也需要很大的代价。
用户可以根据自己的应用情况选择适合自己的方法实现关键业务的连续性。
§1.1 HACMP简介
IBM公司的HACMP for AIX软件是基于AIX平台的,在高可用系统层次实现关键性任务计算环境的工具软件。HACMP应用于RS/6000系列的单处理器机型、对称多处理器机型或SP的节点,可以检测系统故障并快速恢复服务,使最终用户只感受到很小的中断时间。HACMP(High
Availability Cluster Multi-Processing)有两个主要的组成部分:高可用技术(HA)和群集多处理技术(CMP)。
高可用技术
在HA产品出现之前,在UNIX领域实现高可用性的最有效途径是通过容错技术。容错技术依靠专门的硬件设备检测到硬件的故障,然后立即切换至冗余的硬件设备上,不管故障设备是处理器、内存板、电源、I/O子系统还是存储子系统。尽管这种切换能够无缝地提供不间断的服务,但却在硬件费用和性能上付出了很高的代价,因为冗余的设备不能处理事务。更重要的是,容错系统不能处理软件故障,而这却是宕机的最常见的原因。
高可用技术并不是通过将可用性当作一系
列重复的物理设备来实现高可用性,它将高可用性看作是一个全系统范围的、共享的资源的集合,这些资源相互协作来保证关键的服务。高可用技术将软件和工业标
准的硬件结合起来,在系统、设备或应用发生故障时通过快速恢复关键服务来使宕机时间减至最小。尽管不能立即切换,恢复服务也是很快的,通常在1分钟之内。
容错技术和高可用技术的区别在于服务中断的时间。当硬件发生故障时,容错环境没有宕机时间,而高可用环境有很小的宕机时间。但是,在容错环境中,由于软件故障无法被检测,有可能造成系统的严重破坏。而在高可用环境中,软件故障只会造成很小的宕机时间。
现在,大多数的公司都愿意忍受一小段的宕机时间,采用高可用技术,而不愿意花费高得多的代价采用只能检测硬件故障的容错技术。另外,在高可用配置中,备份机还可承担其他应用。
群集多处理技术
群集多处理技术是指一组松散耦合的机器,通过网络连接在一起,共享磁盘资源。在群集中,多个服务器协同工作,为用户提供一组服务或资源。
将两个或多个服务器组成群集来备份关键应用是一个划算的高可用性解决方案。用户可以使用更多的技术能力,同时确保关键应用在硬件或软件故障后能够快速恢复正常工作。
群集多处理技术还为客户提供了灵活的扩展途径。客户可以很容易地在群集中增加处理器以分担不断增加的工作量,还可以对群集中的处理器进行升级。而在容错环境中,则必须同时增加两个处理器,其中一个作为冗余备份,在正常工作时不进行任何处理。
§1.2 HACMP中术语的定义
群集(Cluster):多个服务器节点一起工作,使用TCP/IP进行通讯,每个节点上运行Cluster Manager进程。
节点(Node):群集中的每个运行Cluster Manager进程的独立的机器。节点是HACMP的核心部分,节点上运行AIX操作系统和HACMP for AIX软件。在HACMP群集中,每个节点有一个唯一的节点名。一个节点可能拥有一组资源­­――磁盘、卷组、文件系统、网络、网络地址和应用。节点上一般运行着访问共享磁盘上数据的“后台”应用。
资源(Resources):由一个节点控制的实体,当节点发生故障时能够被其它节点接管。可以被当作资源的实体有:

磁盘、卷组、文件系统

NFS输出的文件系统
★ IP地址

应用程序
关键应用(Critical Application):由HACMP控制其启动和停止的应用程序,例如数据库的后台进程。
事件(Event):群集中发生的一些事情,即群集状态的改变,包括节点up/down,网络up/down,网卡故障等等。
行为(Behavior):事件发生时群集的响应动作。事件是由shell脚本控制的。
重聚(Reintegration):将故障节点、网络、网卡重新带回群集的过程。
下图是HACMP群集的一个例子。在实际的群集中,由于节点数目、网络拓扑、磁盘类型等具体配置的区别,群集的形状可能会不同。

  
  
   
   
   
   
   
   
   
   
   
   
   
   
  
  
  

  
  




  
   
  
  
   
   
file:///C:%5CDOCUME%7E1%5CLUOWEI%7E1%5CLOCALS%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_image002.gif
  


                        
图1:HACMP群集
§1.3 HACMP群集的硬件组成
从上图中可以看出,HACMP群集的硬件由以下硬件组成:

节点

共享磁盘设备

网络和网卡

客户机
1.3.1 节点机型
HACMP for AIX软件支持RS/6000单处理器和SMP机型作为群集的节点。在HACMP中,SMP系统和单处理器机型一样,都被当作单一节点。采用SMP系统是提高整个群集吞吐量的有效途径。群集中的每个节点都可以是一个大的SMP系统,使得群集系统远远超过单个系统的处理能力,可以支持成千上万个客户机连接到单一的数据库系统。
1.3.2 共享磁盘设备
群集中的每个节点都需要配置内置硬盘来存储AIX操作系统、HACMP软件和应用程序。另外,每个节点都应连接到一个或多个外置的共享磁盘上。共享磁盘是指物理上连接到多个节点的磁盘设备,共享磁盘上存放着关键任务的数据,通常采用镜像或RAID技术来提供数据的冗余保护。
HACMP的共享磁盘设备支持SCSI-2 Differential磁盘、SCSI-2 Differential磁盘阵列和串行磁盘。
HACMP支
持两种对共享磁盘的访问方式:非并发访问和并发访问。在非并发访问环境中,每个时间点上只能有一条活动的连接,保持活动连接的节点拥有磁盘,当此节点离开
群集时,它拥有的磁盘被其他节点接管。在并发访问环境中,共享磁盘同时与多个节点保持活动连接,因此当节点故障时,不需要接管磁盘。并发访问要求SSA或RAID作为外置共享磁盘。
共享硬盘应该单独放在一个机柜中,不应和机器混放
1.3.3 网卡
一个节点至少应有两块网卡连接每个网络:一块服务网卡(service adapter)和一块备份网卡(standby adapter)。如果配置IP地址接管,还应配置启动网卡(boot
adapter)。启动网卡并不需要单独的物理网卡,而是配置在服务网卡上的不同的IP地址。
HACMP for AIX采用网卡标识(adapter label)来识别网卡。对于TCP/IP网络,网卡标识是在文件/etc/hosts中关联某一IP地址的名字。一个节点可以定义多个网卡标识和IP地址。
1.3.4 网络
HACMP使用LAN来监视网络,网卡和其它节点的状态,HACMP支持AIX支持的大多数基于TCP/IP 的网络,如 Ethernet、Token-Ring、FDDI、ATM等等。HACMP中定义了三种类型的网络:公用网络(public network)、私用网络(private network)和串行网络(serial network)。
公用网络
在HACMP环境中,公用网络连接多个节点并允许客户机服务群集节点。Ethernet、Token-Ring、FDDI、ATM等网络可以被定义为公用网络。
私用网络
HACMP群集中的节点必须相互通讯以实现对数据的连续访问。私用网络提供两个节点之间的点到点通讯,但不允许客户机访问。HACMP使用私用网络来传输锁的信息,只有在没有定义私用网络时才使用公用网络来传输锁的信息。
私用网络一般用于并发访问磁盘的情况。Ethernet、Token-Ring、FDDI、ATM等网络可以被定义为私用网络。
串行网络
串行网络是两个节点之间的点到点连接。HACMP在TCP/IP子系统发生故障时,使用串行网络来传输控制信息和心跳信息。串行网络可以是一条SCSI-2 Differential总线或一条RS232串行线。
网络名称
网络名称用于标识HACMP群集中的网络,群集进程使用网络名称信息来确定哪些网卡连接在同一物理网络上。网络的命名是任意的,但必须保持一致。如果多个网卡连接在同一物理网络上,定义这些网卡时必须使用相同的网络名称。
1.3.5 客户机
客户机是指能够访问群集中节点的机器。客户机通过公用局域网络与节点通讯,其上运行“前端”程序或客户机应用来访问群集节点上的服务器应用。HACMP for AIX为群集节点上的关键性的数据和应用提供高可用性环境,但不负责客户机的高可用性。
               
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/16863/showart_96575.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP