免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2646 | 回复: 7
打印 上一主题 下一主题

[集群与高可用] 请介绍一下双机热备 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2003-03-26 20:46 |只看该作者 |倒序浏览
请介绍一下双机热备!

论坛徽章:
0
2 [报告]
发表于 2003-03-26 21:07 |只看该作者

请介绍一下双机热备

1、Microsoft Cluster Service
2、Golden life cluster
3、SUN one cluster
4、IBM HACMP
5、Veritas cluster
6、Legato Cluster
7、Longer HA
8、Linux LVS
……

论坛徽章:
1
20周年集字徽章-20	
日期:2020-10-28 14:04:30
3 [报告]
发表于 2003-03-28 08:11 |只看该作者

请介绍一下双机热备

可否介绍下工作原理

论坛徽章:
0
4 [报告]
发表于 2003-03-28 10:29 |只看该作者

请介绍一下双机热备

看看这个,对你有用吧?

http://www-900.ibm.com/cn/support/nav/200202/p50.shtml




下面针对高可用性集群,介绍一下它的工作原理。


在微软的MSCS(Microsoft Cluster Server)术语中,所有的应用程序、数据文件、磁盘、网络IP地址等都被称为资源,一些资源可以组成一个资源组,一个资源组存在于一个节点上,但同时只能在一个节点上,它是MSCS可以进行故障切换(FailOver)的最小单元。


在MSCS中,所有的资源都处于资源监视器的监视之下,资源监视器通过资源动态链接库文件与资源进行通信,这些资源动态链接库会侦测对应资源的状态,并通知资源监视器,之后,监视器再把信息提供给集群服务(Cluster Service),缺省情况下,集群服务会启动一个资源监视器来监视节点中的全部资源。


MSCS用依赖性来定义不同资源彼此之间的关系,MSCS会根据资源间的相互依赖关系来决定把这些资源变为在线或者是离线的顺序。举一个WEB服务器文件共享的例子,文件共享的资源需要硬盘驱动器来存储数据,把这些有关系的资源一起放在MSCS组中,要实现共享,就必须先把硬盘准备好。同时,为了完成文件共享,我们还需要准备好网络名称以及IP地址。



从上图可以看出,文件共享资源依赖于硬盘资源,网络名称资源依赖于IP地址资源,而对应的WEB服务刚依赖于文件共享和网络名称。


资源的存在可以分为五种状态


1、Offline,资源不能被别的资源或者客户机使用
2、Offline Pending,资源正处于Offline的过程中
3、Online,资源处于可用的状态
4、Online Pending,资源正处于Online的过程中
5、Failed,资源出现了MSCS无法解决的问题


前面已经提到,MSCS可以从一个节点故障切换到另一个节点的最小单元是资源组。被定义好的相关的资源放在同一个组中,并建立对应的依赖关系。以下图为例,如果节点A中的资源组1要移到节点B上的话,资源组1中的资源(资源A,资源B,资源C)也必须从节点A移到节点B才行。



在MSCS的资源中,有一个非常重要的资源,Quorum,它是一个可以被两个节点访问的物理硬盘,用来保存集群的信息。这些信息是用来维护集群的完整性以及使节点保持同步,特别是当节点不能与另一个节点通信的时候。Quorum盘在某一时刻只能被一个节点所拥有,并用来决定由哪个节点来拥有集群的所有资源。Quorum必须位于共享的磁盘子系统中,一般都是使用外接的磁盘柜。一般情况下,不建议把应用

程序和数据保存到包含Quorum的硬盘上。
故障切换(Failover)是指把出现故障的节点上的资源重新定位到另一个可用的节点上。负责监视资源的资源监视器一旦发现资源出现故障,它就会通知集群服务,集群服务会根据事前定义好的策略触发对应的事件。虽然发现的是个别资源的故障,但是,集群还是会把整个资源组进行故障切换。
故障切换会在三种不同的情况下发生:人工(一般是因为管理员的请求),自动,或者在特定的时间(由集群管理软件设定)。自动故障切换又包含了三个阶段:1、故障发现。2、资源重新定位。3、重新启动应用程序(一般是故障切换过程中最耗费时间的)。当达到资源组的故障切换阀值时,自动的故障切换才会发生,阀值是可以设定的,一般由管理员来设定。


故障恢复(Failback)是一种故障切换的特例,是指发生故障切换之后,把部分或者全部资源组移回它们首选的节点的过程。首选的节点,就是指集群中指定的运行资源组的道选的节点,如果是多个节点的高可用性方案,就会有多个首选的节点。当首选的节点出现故障后,对应的资源组就切换到另外的可用节点上,当出现故障的节点恢复正常后,资源组可以自动的切换回首选节点。如果没有定义首选节点,资源组就不会自动切换回来。


要检查资源是不是可用,资源监视器会向对应的动态链接库发送状态信息的请求,一般会有两种级别的检查,LooksAlive和IsAlive。LooksAlive级别的检查相对比较简单,每隔一段时间(相对比较短的时间,缺省是5秒),资源监视器会进行一次LooksAlive级别的检查,如果资源没有响应,监视器会向集群服务报告。IsAlive级别的检查是非常完整的检查,它会彻底检查资源是不是工作正常,IsAlive检查的时间间隔比LooksAlive要长,缺省是1分钟。


结合上面提到的各个要素,高可用性就是通过下面的过程来实现的:


首先,资源监视器根据设定的时间间隔对资源进行LookAlive和IsAlive两种级别的检查,一旦发现某一个资源不可用,就会试图重新启动该资源。根据阀值的设定,如果在某一时间段内,资源不可用的情况达到了设定的阀值时,就会发生故障切换。经过故障切换的过程,对应的资源组在另外一个节点上重新启动了,继续为客户机提供服务,对客户来说,工作没有影响,这就完成了一次故障切换。当出现故障的节点恢复正常以后,如果事先对该资源组设定了首选节点,就会把该资源组移回该首选节点。


经过前面的介绍,我们已经对高可用性的原理有了一些了解,下面,我们具体阐述一下相关的方案。


目前,各个公司的服务器产品都提供了高可用性方案,而IBM,针对微软新推出的Windows 2000 Datacenter Server,也提供了全面的解决方案。


Microsoft Windows 2000 Datacenter Server 操作系统是为了那些将高度可靠的高端硬件和软件用于其大型通讯计算机网络组件的企业而设计的。它是Microsoft有史以来提供的最强大和有效的服务器操作系统。它支持最大32个对称多处理器(SMP)和最多64GB的物理内存。作为标准功能,它同时提供4节点群集和负载平衡服务。它也提供Windows 2000所有版本的丰富Internet和网络操作系统(NOS)服务。它是为大型数据存储、经济分析、科学和工程中的大型模拟、在线事务处理(OLTP)和服务的合并作过优化的。目前,Windows 2000 Datacenter Server 只提供给原始设备制造商,由原始设备制造商向客户提供相应的解决方案。


IBM 通过对硬件和软件部件进行不断的严格测试,为客户提供经过 Windows 2000 Datacenter Server 认证的解决方案,这种认证可以确保方案只包含通过测试的硬件、设备驱动程序以及经过确认的核心级应用程序。IBM 通过 ServerProven 和 ClusterProven 来完成这些全面的测试。


IBM拥有支持企业级用户的丰富经验,IBM Datacenter Solution Program 提供了基于 Microsoft Datacenter 操作系统的全套方案,包括经过认证的硬件配置,经过认证的核心级应用程序以及标准的和可选的服务,IBM也与其它的方案开发商以及硬件开发商合作,使他们的部件在IBM的Datacenter方案中可用。


IBM Datacenter Solution Program 是以 Microsoft Datacenter 操作系统为中心,它可以支持比 Windows 2000 Advanced Server 和 Windows 2000 Server 更大的内存、处理器以及节点,同时,IBM 还通过独有的企业级X架构技术,提供杰出的扩展性,系统管理性以及适用性。IBM Datacenter Solution Program 是设计用来提供关键业务所需要的服务和支持级别的。为了实现一个高可用性方案,您需要一个稳定的配置,它具有可控制的更改以及更好的支持和服务。IBM Global Services(IGS)拥有足够的经验来提供适合的服务。


目前,IBM xSeries 440 是 Datacenter 方案的基本组成部分,由于采用了为关键业务设计的企业级X架构技术,x440提供了更高的可用性,支持8路对称多处理器,可选配置包括1.5GHz 512KB Cache 或者 1.6GHz 1MB Cache 的Intel Xeon MP 处理器,2GB ECC SDRAM 内存,两个内置硬盘,外接的光纤通道存储设备以及多种网络连接设备等,而高性能的I/O子系统和高可用性使x440成为Datacenter Server的最佳选择。除了预装Windows 2000 Datacenter Server以外,方案中还包括IBM Director 3.1 和 APC UPS 的相关软件。




Datacenter 的认证必须经过严格的测试过程,这其中还包括相应的软件产品,以确保其不会对操作系统有任何的影响,除此之外,IBM还致力于与业界著名的软件开发商合作,来确保他们的应用程序可以在 Datacenter 可能遇到的高负荷下正常工作。同时,IBM还对 Datacenter 系统提供的系统管理,存储管理以及数据库进行全面的测试来满足客户的需求。另外,位于微软总部旁边的IBM Center for Microsoft Technologies,拥有130资深的专业技术人员,与微软合作开发最佳的解决方案。


在IBM Datacenter Solution Program中,IBM Global Services(IGS)提供了一系列标准的和可选的服务,包括硬件集成和操作系统的安装,System Assurance Review,7天24小时当天的硬件服务。通过提供硬件集成和操作系统的安装,IBM可以对硬件配置的可行性进行完全的测试。


要了解更多Datacenter的相关信息,可以访问下面的网址:


http://www.pc.ibm.com/ww/eserver/xseries/windows/datacenter.html

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
5 [报告]
发表于 2003-03-28 18:35 |只看该作者

请介绍一下双机热备

长见识

论坛徽章:
0
6 [报告]
发表于 2003-03-31 10:40 |只看该作者

请介绍一下双机热备

谢谢!

论坛徽章:
0
7 [报告]
发表于 2003-04-05 11:32 |只看该作者

请介绍一下双机热备

golden life 是谁家的产品?

论坛徽章:
0
8 [报告]
发表于 2003-04-07 18:56 |只看该作者

请介绍一下双机热备

golden life 是国内的几个人搞出来的产品,去年才有,和LifeKeeper仔细比较,可以看出一些问题,包括它的技术白皮书和界面
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP