免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 870 | 回复: 0
打印 上一主题 下一主题

[集群与高可用] 双机热备应对中小企业关键业务运营 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-05-18 17:53 |只看该作者 |倒序浏览
选择适当的RAID级别以及备份方式可以满足企业用户对存储系统可用性、性能和容量的要求。但是对于企业关键业务而言,仅仅保证存储系统的可用性还远远不够,因此我们通常采用双机高可用方案来应对关键业务。
只是备份和RAID足够吗?
    首先,关键业务往往有连续运营的需求,双机高可用方案通常采用外置存储阵列,从而我们可采用数据备份和各种数据保护方式提高系统连续运营能力。磁盘上的数据备份尽管重要且必不可缺的,但局限在于属于事后的补救措施无法保证服务器运营不中断。而RAID等一些其它数据保护方式也只能解决存储磁盘连续工作可靠性,无法解决服务器应用连续性问题。
    一台服务器有可能发生各式各样的故障,故障来源则完全无法预期,如服务器硬件故障,IO设备故障、操作系统故障、软件故障,通信线路故障等。故障不仅仅可能发生在系统管理员在的时候,也可能发生在系统管理员不在现场的时候,因此一个服务器互为备份且能够自动恢复的系统就变得极其重要。这并不是说一个系统一定要做双机热备,但不管怎么样,如果你有比较重要的应用系统,就一定要研究一下相应的问题。否则,一旦系统停上半天一天,将对业务造成不可估量的损失。
    总之,企业是否使用双机热备,决定于系统的重要性以及中断对系统的影响。双机热备解决方案可以在短时间内(如1~30秒内)恢复系统运行。而手工恢复故障通常需要三十分钟左右,如果技术人员不在现场故障恢复时间要更长,这还要根据故障的类型而定。而对于一些重要系统来说,是很难忍受长时间的服务中断的。因此双机热备方案是目前应用最为广泛的保障企业业务连续的方案之一。
两种应用模式承担关键业务
    在应用双机热备时,典型的有主从和互备两种应用模式。主从模式是最标准、最简单的双机热备,即是目前通常所说的active/standby方式。
    它的工作原理是使用两台服务器,一台作为主服务器(Active),运行应用系统来提供服务。另一台作为备机,安装完全一样的应用系统,但处于待机状态(Standby)。当active服务器出现故障的时候,通过软件诊测将standby机器激活,保证应用在短时间内完全恢复正常使用。双机互备方式则是在双机热备的基础上,两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,这种方式实际上是双机热备的一种应用。但目前使用最多的依然是主从模式的双机热备。

     目前基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器,使用共享的存储设备(磁盘阵列柜或存储区域网SAN)。两台服务器可以采用主从、互备等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。对于用户而言,这一过程是全自动的,在很短时间内完成,从而对业务不会造成影响。

实现存储资源共享
    数据库双机热备有两种典型的方式,一种是比较标准的,两台服务器通过一个共享的存储设备,并且安装双机软件,实现双机热备,称为共享方式。另一种方式是通过纯软件的方式,一般称为镜像的方式。
    对于共享方式,数据库放在共享的存储设备上。当一台服务器提供服务时,直接在存储设备上进行读写。而当系统切换后,另一台服务器也同样读取该存储设备上的数据。对于纯软件的方式,通过镜像软件,将数据可以实时复制到另一台服务器上,这样同样的数据就在两台服务器上各存在一份,如果一台服务器出现故障,可以及时切换到另一台服务器。纯软件方式有几大优点:首先避免了磁盘阵列的单点故障;其次节约投资,不需购买昂贵的磁盘阵列;第三不受距离的限制,两台服务器不需受SCSI电缆的长度限制(光纤通道的磁盘阵列也不受距离限制,但投资更大);最后是存在两份数据,不管怎么样也多了一点安全性。
    镜像软件可以以两种方式处理这个过程,一种是同步方式,即只有在复制也完成后,原来的操作才算成功。另一种是异步方式,只要源数据操作完成,就算成功,复制工作在其后进行。前一种方式对于数据库的写入的速度会有一定的影响,而后一种方式则在切换时有可能会产生数据的丢失。应该说,对于纯软件方式的应用,要看具体的应用情况。如果频繁进行写入,对响应速度要求很高,则这种方式未必理想。如果写入的频率不是很高,写入的小小的时延可以承受,则这种方式的好处还是很大的。
    企业在采用双机热备方案除了要考虑稳定性、经济性、安全性、前瞻性和先进性等外,最主要的是要考虑它的可扩展性,在硬件的选择上,配备稳定性高、易扩充的磁盘阵列,适应平滑升级,保护现有投资。在存储软件的选择上,可扩展性也显得非常重要。实际上只有系统软硬件均符合技术发展潮流,采用相关的先进技术,在功能上相辅相成,整个系统的平滑升级才能成为可能。
通过Windows平台实现双机热备
    目前双机热备方案可以在UNIX、Linux和Windows三种常用的操作系统下实施。Windows 平台下能实现双机热备软件很多,例如微软的群集软件MSCS,MSCS的主要用途是通过自身提供的容错能力提高应用程序可用性。容错能力是指将相关处理过程从某个节点上的故障应用程序(由于硬件设备故障或软件错误等原因所导致)移植到群集中其它健康节点上的群集功能。
    当故障应用程序得到恢复后,群集应当能够对原先的群集节点实现“故障返回”。MSCS能够在不丢失任何与故障应用程序相关数据的前提下对群集上所运行的应用程序进行故障恢复与故障返回管理,并且能够在故障恢复过程中维护用户及应用程序状态。对于诸如电子邮件服务器、数据库应用程序之类的应用程序,MSCS是一种良好的运行方式。
    ROSE HA (High Availability)为提供主机当机时可以在最短的时间内回复正常作业的高可靠性软件。它提供防止主机因意外当机造成长时间停机,以最低之成本提供用户近乎不停顿之计算机作业环境当一部工作主机(active server)当机或无法使用时,ROSE HA 将自动侦测出故障并激活备援主机(backup server)内预先设定之程序依序进行接替(take over)。源系统的任何数据更新将通过LANs和WANs镜像到用户指定的目标系统上,当源系统发生数据丢失或硬盘损坏时在目标系统上能够得到一份镜像文件。
    ROSE HA可以实现一对一、一对多、多对一及多对多的数据镜像而不需要任何附加的硬件设备,ROSE HA 在两部主机上执行,提供相互备援保护监测程序(HA Daemon),如果任何一部主机上之作业处理被不正常中止, ROSE HA 将自动重新激活该被中止之作业.此过程不需要人为操作介入,此种防错功能可确保重要的服务不被中断。在正常的运作情形之下,主机之间透过冗余侦测线路互相侦测,当任一主机有错误产生时,ROSE HA提供严谨的判断与分析,确认主机出错之后,才完全启动备援接管动作。
UNIX下的双机热备
    以IBM、HP和SUN为代表的UNIX环境下都有双机热备解决方案,如IBM Hacmp(High Availability Cluster Multi-Processing)双机热备份软件的主要功能是提高企业客户计算机系统及其应用的可靠性,而不是单台主机的可靠性。
    HACMP是利用LAN来监控主机及网络、网卡的状态。在一个HACMP环境中有TCP/IP网络和非TCP/IP网络。TCP/IP网络即应用客户端访问的公共网,该网可以是大多数AIX所支持的网络,如Ethernet,T.R.,FDDI,ATM,SOCC,SLIP,等等。非TCP/IP网络用来为HACMP对HA环境(Cluster)中的各节点进行监控而提供的一个替代TCP/IP的通讯路径,它可以是用RS232串口线将各节点连接起来,也可以是将各节点的SCSI卡或SSA卡设置成Target Mode方式。
    作为双机系统的两台服务器(主机A和B)同时运行Hacmp软件;服务器除正常运行自机的应用外,同时又作为对方的备份主机;两台主机系统(A和B)在整个运行过程中,通过 “心跳线”相互监测对方的运行情况(包括系统的软硬件运行、网络通讯和应用运行情况等);一旦发现对方主机的运行不正常(出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行;应用和资源的接管过程由HA软件自动完成,无需人工干预;当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机(备份机)上运行。另外HP 的ServiceGuard、SUN的suncluster都可以实现双机热备功能。
Linux环境下实现双机热备
    Linux环境下双机热备软件可以采用Steeleye的Lifekeeper for Linux ,LifeKeeper 提供直观的基于Java的图形接口,方便实现跨平台配置、管理和状态监控; 同时也包括一个完整的命令行接口。SteelEye公司的LifeKeeper for Linux 一个通过保持系统正常运行而确保应用具有持续可用性的软件应用。LifeKeeper 实现以双机热备方式连接在一起的linux系统的高可用性,这是通过监控系统及应用健康状态,保持客户连接性并为任何客户,无论位于互联网、内联网还是外联网提高不间断的数据存取。为了使系统及应用能在宕机是自动恢复,LifeKeeper允许将在应用在发生错误时切换到双机中的另一台服务器上。这有助于LifeKeeper将单点失败的风险降低到最低,从而在Linux系统上创建一种抗错环境以满足关键任务操作的严格可用性要求。
    Redhat Linux系统下的双机热备份系统的实现,使用的双机控制软件是Linux-HA heartbeat。因此,除了安装操作系统及相关的应用服务程序之外,还需要安装heartbeat控制软件。通过对heartbeat软件的配置,可以把两台服务器分别指定为主节点和从节点,指定心跳信号的时间间隔,指定cluster IP、子网掩码、广播地址、鉴权方式,还可以设置heartbeat启动的服务,该服务最终由双机系统通过cluster IP对外提供。Heartbeat可以最大限度地保护用户端的应用连续性。用户的硬件资源(如网卡),软件资源(如操作系统、数据库管理系统、数据库应用系统、电子邮件系统等)均能处于heartbeat容错软件的保护之下,当这些被保护的资源出现技术故障时, heartbeat容错软件可以随时实施系统资源的切换。因此,heartbeat真正实现了用户硬件或是软件资源发生故障时系统及应用层上的在线热切换。
    因此无论是大中小企业,根据业务应用的重要性不同,都可以采用双机热备解决方案,特别是电信、政府、税务、银行等行业重要应用系统,需要7X24X365永远运行的业务,一般都会使用双机热备或者集群方式来保证企业应用“万无一失”。当然使用双机热备需要有资金支持的,无论是从硬件和软件上我们必须要全盘考虑好,特别是UNIX环境下,配置HA是非常麻烦的事等,这些问题是我们企业在实施双机热备过程中必须要重视的。
    作者:务实,长期从事于网管,系统运行维护等工作。


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/69258/showart_692990.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP