免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1003 | 回复: 0
打印 上一主题 下一主题

[集群与高可用] 双机热备份系统 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-06 04:47 |只看该作者 |倒序浏览
、现实环境及方案要求
在今天的商务应用系统中,稳定持续的系统运行时间变得越来越重要,由于计算机软件和硬件都会不可避免地发生故障,而这些故障都可能给企业带来极大的损失,而传统意义中的小型机系统使得普通用户望而却步。
用户需用的是更高的可用性以及更低的成本。所以对于现代企业来说,利用双机热备份系统来提供及时可靠的信息和服务已经成为保证企业数据安全的一种必要措施。双机热备系统是一种提供高可用性、改善性能和增强企业应用软件可管理性的有效途径。随着基于Intel平台的服务器业已成为关键性业务和应用的主流服务器,双机热备份技术的应用也日益广泛。
所谓双机热备份是指系统对主机及硬盘、通讯线路等核心设备,采用双机备份,当系统正常时主机进行工作,并且每隔设定时间系统自动检测,若发现
问题
,系统能够自动切换到备份机继续工作,保证不影响系统的正常运行。
它的优点就是可有效地提高系统的可用性。如果一个服务器或应用程序崩溃,热备分系统中另一个服务器在继续工作的同时,接管崩溃服务器的任务,最大限度地缩短用户服务器和应用程序宕机的时间。下面笔者就来介绍一下中型企业如何利用IBM X255服务器和IBM的磁盘阵列EXP300实现双机容错的方案。二、 方案总体部署
双机热备份方案的网络结构框架如下图所示。它需要两台服务器进行群集,通常是同一型号的。至少四块网卡,其中的两块用于两台服务器主机集群内部的“心跳”同步,另两块分别用于两台服务器与局域网的连接。除此之外,因为要共享使用磁盘存储,所以通常还需要一个磁盘阵列,其总线类型要视具体需求而定,一般情况下,SCSI总线即可,如果需要高性能的磁盘存储,则可选择光纤通道,当然这也就要求两台服务器和磁盘阵列支持相应的总线类型。整个双机热备份系统中,两台服务器的操作系统各自安装在两台服务器的本地存储系统中,只是需要共享的数据,如数据软件和数据文档等,就需要存放在共用的磁盘阵列中。
网络结构框架图(点击看大图)
根据以上企业的具体需求,为了尽可能地降低企业双机备份方案成本,我们选择了IBM的X系列服务器+EXP扩展磁盘阵列双机备份方案。因该企业已有一台IBM X255服务器,再加上这台服务器的整体配置已相当不错,所以在服务器主机上选择IBM X255,磁盘阵列方面,根据实际需求,选择了低成本、仅支持SCSI总线类型的EXP300。这种IBM X255服务器与EXP300磁盘阵列的双机备份方案的网络结构与图1图是一样的,具体产品连接如下图所示。
产品连接图(点击看大图)
在这种热备份方案中(配置成RAID 5阵列模式),所需的硬件包括如下几个部分:
服务器主机:两台IBM X255服务器;
 主机网卡:采用10/100/1000MM网卡,因每台IBM X255服务器集成有一块10/100/1000MM网卡,所以实际上只需为每台主机另外配置一块10/100/1000MM网卡即可;
 外置磁盘扩展柜:一台EXP300
 其他:外置SCSI电缆两条(P/N: 03K9195)(用于连接磁盘阵列,EXP 300仅支持SCSI总线类型);热插拔硬盘三块以上(用于配置RAID 5)
所需软件配置如下:
Windows 2000 Advanced Server或Windows Server 2003企业版两套(需安装有Custer(群集)组件)(不需要购买双机备份所需的服务器群集软件,可节省开支)
 数据库最好选用微软自己的企业版SQL数据库(目前对Windows 2000 Advanced Server和Windows Server 2003的群集支持最好)
 IBM ServeRAID BIOS/Firmware Update Diskette
 IBM ServeRAID Cluster Solution
 IBM ServerGuide Setup and Installation CD,此软件随机赠送
 IBM ServeRAID Manager
 IBM ServeRAID Device Drivers
 其他相关的软盘(例如网卡驱动等会随选件购买而带)
整个系统由两台IBM高端服务器IBM X255、一台EXP300磁盘阵列柜和 和块磁盘阵列卡构成双机备份模式,双台服务器互为备份,当一台服务器出现
问题
停机时,另一台服务器能实时接管中断的工作,保证业务系统的正常运行。EXP300磁盘柜磁盘具有热插拔功能,具可以灵活组成RAID模式,当一块硬盘损坏,数据可以恢复,保证数据不丢失。
由于采用了双机容错的集群结构,系统具有极高的可靠性。两台服务器可以作为一个整体对网络提供服务,且相互间互为监控。集群具有一定的负载平衡功能,可将一个任务的多个进程分摊到两台服务上运行,提高系统的整体性能。当一台服务器发生故障时,其上所运行的进程及服务可以自动地由另一台服务器接管,保证网络用户的工作不受影响。同时,如果系统采用RAID技术对数据进行保护,可确保重要数据不因系统故障而造成损失。
这个系统总体来说,具有以下几方面的特点:
(1) 高可靠性
 支持冗余磁盘阵列
 冗余电源和风扇设计
 所有部件均支持热插拔
 主机可各自运行自己的应用,互为备份,共享磁盘数据
(2) 高性能
 单块IBM ServeRAID卡数据传输带宽可达160MB/s(可升级到320MB/s)
 数据传输I/O可达3000次/s
 主机与磁盘间的距离可达25米
(3) 高可用性
采用SSA设计,单块磁盘或者线路实效不影响整个磁盘的读写
另外还具有高容错性和系统安全高效性。三、选型产品介绍
在这个方案主要用到的产品包括三大部分:IBM X255服务器、EXP300 磁盘阵列、ServeRaid 4磁盘阵列卡。因在IBM X255服务器中已集成ServeRaid 4磁盘阵列卡,所以下面仅对IBM X255服务器和EXP300 磁盘阵列进简单介绍。
1. IBM X255服务器
IBM xSeries 255是高性能的4路基于Intel Xeon处理器的服务器,设计用于满足不断增长的商业环境以运行关键商务应用程序,如图3所示。xSeries 255 服务器已成为目前企业电子邮件消息和工作组协作解决方案以及数据挖掘、数据仓库和其它需要大量计算处理的商业分析环境的理想选择。xSeries 255 服务器采用桌面系统配置并可以在数分钟内安置在满足行业标准要求的机柜中。支持高达360GB 的内部磁盘数据存储容量和多磁带备份功能,使系统扩展和数据备份更加容易。
IBM xSeries 255(点击看大图)
2. IBM EXP300
IBM的磁盘柜EXP300是专为企业级关键商业应用而设计,具备很高的数据存储可扩展性、数据安全性和访问能力,EXP200/EXP300具有关键的可靠性增强特性、更快的数据访问能力,并且驱动器扩展能力强、性价比高,支持磁盘驱动器的预测故障分析(PFA),支持14个盘位,存储容量最高可达1TB(14个73GB的磁盘)。
IBM EXP300
目前采用IBM磁盘柜 EXP300+RAID卡这种方式组成企业级存储方案较多,具备很高的数据存储可扩展性、数据安全性和访问能力,EXP300具有关键的可靠性增强特性、更快的数据访问能力,驱动器扩展能力比EXP200高40%。
IBM磁盘阵列柜支持利用Microsoft Cluster技术实现高可用的双机热备份。Microsoft的Cluster包含在Windows NT 、Windows 2000和Windwos Server 2003系统的企业版中。拥有适当数量、I/O性能和容量的HDD对系统的性能是十分关键的。研究表明,采用的HDD越多,每秒钟所能进行的存储访问操作就越多:通常情况下,把驱动器数量增加一倍可以使系统性能提高50%。
EXP300 磁盘阵列柜可装14块硬盘驱动器(HDD),最大存储容量可达734GB,需要时可以添加Netfinity EXP存储扩展单元;可容纳 14个扩展单元的标准机架,最大可以存储10.2TB的数据,具有热插拔能力,冗余、自监控和报警功能使得性能可靠并易于维护。
EXP300主要具有以下几方面的特性:
良好的可用性和可管理性
IBM EXP存储扩展单元设计时十分注重其可靠性,它是系统可用性及群集方案的最佳选择。所有Netfinity EXP 单元都支持磁盘驱动器的预测故障分析(PFA),使您可以了解何时一个HDD表现异常并可能发生故障。热插拔能力使您在PFA判定的HDD发生故障前方便地进行替换。更妙的是,经PFA判定故障的硬盘在保修期内可以更换。EXP300更是具有内置的LED指示器,能够预先对故障、温度超标和其它异常发出警告。
所有IBM EXP单元都提供了冗余、热插拔风扇和热插拔电源。另外,EXP300的双冗余电源使您可以更加放心,提供两个500W热插拔,而且每个电源内又具有双风扇冗余。热插拔和SAF-TE(SCSI Accessed Fault-Tolerant Enclosures)能力使您可以在不打断重要计算服务的情况下对部件进行替换和升级。您还可以利用Netfinity DirectorTM系统管理软件方便地管理EXP300单元和其中的SCSI HDD。Netfinity Director和相关的生命周期工具拥有极佳的本地或远程控制能力,增强了您的管理能力。例如,容量管理器(Capacity Manager)提醒您注意当前和即将出现的性能瓶颈,帮您在整个系统生命期间跟上变化的数据存储需求。
极佳的可扩展性和高容量
IBM存储扩展单元提供了极大的存储能力,并且扩展性很强,能够满足您企业的存储需求。每个扩展单元都是一个3U的可架装托架;一个标准的42U机架可以放置14个单元。EXP300单元还有可选的机架到塔式转换套件,使配置更加灵活。为获得高性能和高容量,EXP300支持10,000rpm和7200rpm的HDD。这种单元也都采用了Netfinity集中支架(Converged Carrier),这一可互换的支架便于HDD的安装以及在大多数Netfinity服务器和EXP单元之间的转移。
EXP300采用了Ultra160 SCSI技术,数据传输速度比Ultra2 SCSI快一倍。EXP300拥有14个超薄HDD槽位,扩展能力比EXP200增强40%,可以容纳最大509GB的存储量。为提高可靠性,EXP300支持HDD和自身风扇的PFA。通过采用通用的Netfinity集中支架,EXP300可以同时支持Ultra160和Ultra2 HDD,降低了技术转换的成本。三、选型产品介绍
在这个方案主要用到的产品包括三大部分:IBM X255服务器、EXP300 磁盘阵列、ServeRaid 4磁盘阵列卡。因在IBM X255服务器中已集成ServeRaid 4磁盘阵列卡,所以下面仅对IBM X255服务器和EXP300 磁盘阵列进简单介绍。
1. IBM X255服务器
IBM xSeries 255是高性能的4路基于Intel Xeon处理器的服务器,设计用于满足不断增长的商业环境以运行关键商务应用程序,如图3所示。xSeries 255 服务器已成为目前企业电子邮件消息和工作组协作解决方案以及数据挖掘、数据仓库和其它需要大量计算处理的商业分析环境的理想选择。xSeries 255 服务器采用桌面系统配置并可以在数分钟内安置在满足行业标准要求的机柜中。支持高达360GB 的内部磁盘数据存储容量和多磁带备份功能,使系统扩展和数据备份更加容易。
IBM xSeries 255(点击看大图)
2. IBM EXP300
IBM的磁盘柜EXP300是专为企业级关键商业应用而设计,具备很高的数据存储可扩展性、数据安全性和访问能力,EXP200/EXP300具有关键的可靠性增强特性、更快的数据访问能力,并且驱动器扩展能力强、性价比高,支持磁盘驱动器的预测故障分析(PFA),支持14个盘位,存储容量最高可达1TB(14个73GB的磁盘)。
IBM EXP300
目前采用IBM磁盘柜 EXP300+RAID卡这种方式组成企业级存储方案较多,具备很高的数据存储可扩展性、数据安全性和访问能力,EXP300具有关键的可靠性增强特性、更快的数据访问能力,驱动器扩展能力比EXP200高40%。
IBM磁盘阵列柜支持利用Microsoft Cluster技术实现高可用的双机热备份。Microsoft的Cluster包含在Windows NT 、Windows 2000和Windwos Server 2003系统的企业版中。拥有适当数量、I/O性能和容量的HDD对系统的性能是十分关键的。研究表明,采用的HDD越多,每秒钟所能进行的存储访问操作就越多:通常情况下,把驱动器数量增加一倍可以使系统性能提高50%。
EXP300 磁盘阵列柜可装14块硬盘驱动器(HDD),最大存储容量可达734GB,需要时可以添加Netfinity EXP存储扩展单元;可容纳 14个扩展单元的标准机架,最大可以存储10.2TB的数据,具有热插拔能力,冗余、自监控和报警功能使得性能可靠并易于维护。
EXP300主要具有以下几方面的特性:
良好的可用性和可管理性
IBM EXP存储扩展单元设计时十分注重其可靠性,它是系统可用性及群集方案的最佳选择。所有Netfinity EXP 单元都支持磁盘驱动器的预测故障分析(PFA),使您可以了解何时一个HDD表现异常并可能发生故障。热插拔能力使您在PFA判定的HDD发生故障前方便地进行替换。更妙的是,经PFA判定故障的硬盘在保修期内可以更换。EXP300更是具有内置的LED指示器,能够预先对故障、温度超标和其它异常发出警告。
所有IBM EXP单元都提供了冗余、热插拔风扇和热插拔电源。另外,EXP300的双冗余电源使您可以更加放心,提供两个500W热插拔,而且每个电源内又具有双风扇冗余。热插拔和SAF-TE(SCSI Accessed Fault-Tolerant Enclosures)能力使您可以在不打断重要计算服务的情况下对部件进行替换和升级。您还可以利用Netfinity DirectorTM系统管理软件方便地管理EXP300单元和其中的SCSI HDD。Netfinity Director和相关的生命周期工具拥有极佳的本地或远程控制能力,增强了您的管理能力。例如,容量管理器(Capacity Manager)提醒您注意当前和即将出现的性能瓶颈,帮您在整个系统生命期间跟上变化的数据存储需求。
极佳的可扩展性和高容量
IBM存储扩展单元提供了极大的存储能力,并且扩展性很强,能够满足您企业的存储需求。每个扩展单元都是一个3U的可架装托架;一个标准的42U机架可以放置14个单元。EXP300单元还有可选的机架到塔式转换套件,使配置更加灵活。为获得高性能和高容量,EXP300支持10,000rpm和7200rpm的HDD。这种单元也都采用了Netfinity集中支架(Converged Carrier),这一可互换的支架便于HDD的安装以及在大多数Netfinity服务器和EXP单元之间的转移。
EXP300采用了Ultra160 SCSI技术,数据传输速度比Ultra2 SCSI快一倍。EXP300拥有14个超薄HDD槽位,扩展能力比EXP200增强40%,可以容纳最大509GB的存储量。为提高可靠性,EXP300支持HDD和自身风扇的PFA。通过采用通用的Netfinity集中支架,EXP300可以同时支持Ultra160和Ultra2 HDD,降低了技术转换的成本。 四、编后语
从以上方案介绍可得知这种双机热备份方案最大的特点就是较低的成本、非常高的稳定性能和可扩展性能。
因为它采用的是比较实用的SCSI总线存储类型,充分利用了操作系统Windows 2000 Advanced Server或Windows Server 2003企业版系统的群集技术,节省了用户另外购买双机备份所需的群集软件。
同时因为采用了微软的网络操作系统和SQL数据库系统,兼容性最好,而且SQL数据库系统也具有非常广泛的应用,其优良的性能和强大的功能已得到无数用户的认可。
还有一个最大的特点就是,IBM X255服务器和EXP300 磁盘阵列都具有非常完善的冗余机制和极佳的可扩展性能,使得用户不再需要过多地对系统的稳定性能和可扩展性操心,完全可以满足企业7*24小时恒久稳定运作,以及长期的存储容量和性能需求。
-------------------------------------------------------------------------------------------------------
所谓双机热备,就是将中心服务器安装成互为备份的两台服务器,并且在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会迅速的自动启动并运行。我们来看看在WIN2000服务器版下的实现过程。
一、 硬件准备及基本安装综述
网络服务器 两台
网络服务网卡 四块
服务器硬盘 两块
SCSI磁盘阵列 一个
SCSI硬盘 三块
首先是将两台服务器都配置成双网卡,并分别安装Win2000 Advance Server(高级服务器版)。之后配置网络环境使之畅通:将两台服务器加入到域当中,成为域成员,并在每台服务器上设置管理员权限。
另外就是注意所有磁盘必须设置成基本盘并做成采用NTFS格式分区,磁盘阵列分区一定要大于2个。最后将三块SCSI硬盘做成磁盘阵列,笔者建议为RAID5(在配置阵列时,一定注意单独分一个至少1G的分区出来,用于存放配置数据库的检测点以及日志文件)。
二、 具体安装要点。
配置服务器网络环境要点
1、 在前一步中,我们将两台服务器都安装了双网卡,一个用于连接公网(internet),一个连接内部局域网。
将连接内部局域网的网卡建立点对点的通信和群集状态信号,然后每个终端的公网适配器连接该群集到公网上,并在此驻留客户。
2、 待win2000高级服务器版安装好后,开始配置每台服务器的网络参数。在网络连接将连接公网的改为“外网”,连接局域网的改为“内网”,然后将两台服务器的各自网卡分别指定IP地址为:
服务器A:外网IP为:192.168.0.160,内网IP为:10.10.10.1,子网掩码为:255.255.255.0 网关为:192.168.0.1(此处网关为你主域控制器的IP地址)
服务器B:外网IP为:192.168.0.161,内网IP为:10.10.10.2,子网掩码为:255.255.255.0 网关为:192.168.0.1
安装服务软件要点
配置服务器A
1、 所有的设备都先关闭后再开启磁盘阵列。
2、 启动服务器A,用事先设置的管理员帐号登陆到域;然后在添加/删除程序选项里添加“集群服务”组件,并注意在安装过程中将此组件设置为集群的首节点,接着创建集群名称(任取即可,比如
myserver)。
3、 由于我们只有一个共享的磁盘阵列,所以应该将此阵列中的分区都配置成群集磁盘。
4、 开始配置群集网络。外网和内网的配置相同,即群集网络的外网、内网的名称和IP地址要保持跟网络适配器一致,至外还要选中该网络可用于集群服务,外网要选中所有的通信(混合网络)选项,而内网只选中用于内部群集的通信选项。在接着出现的“使用网络顺序”对话框中,调整为表里的第一个连接是内网(解释:在正常的操作中,该连接将用于群集通信。如果此连接失效,群集服务将自动切换到表里的下一个网络),继续下一步会出现集群的IP地址和掩码选项,设置集群IP地址为192.168.0.162,子网掩码为:255.255.255.0。单击完成即可。
配置配置服务器B
首先一定保持磁盘阵列和服务器A的开机和可用,然后才启动服务器B。接着同样安装“集群服务”组件,安装过程大致与服务器A相同,唯一注意的地方是在创建或添加群集的对话框中,在群集中选择第二个或下一个节点,并单击下一步;接着输入前面所创建的群集名称(本例为myserver),在下一步中将连接到群集设为未选中,这样群集服务配置向导会自动提供前面在安装服务器A时选定的帐号名,输入该帐号的口令后一路点击下一步并最终结束配置。
最后我们应检测以上操作是否成功。依次单击“开始”—“程序”—“管理工具”,打开“群集管理器”,如果看到显示有这两个节点,表明群集已被正常配置并已开始运行。
三、 功能检测。
我们主要来看看它的容错能力,以下是笔者的一些检测:
1、 在两台服务器以及集群服务同时运行的情况下,断掉其中一台服务器的外网连接,此时运行在此服务器上的集群服务会被迫自动断开并转移到另外一个连接正常的节点上(此过程所需时间视你服务器开展的服务数量而定,一般4秒钟左右)。或是可以更改一台服务器的系统时间,经过几分钟,被改动的时间会自动调整成同另一台节点相同。
2、 在集群服务上开启web服务,并设置好下载项目。在用户端开始下载项目,接着马上断掉集群中的一个节点,结果用户端并无明显的感觉掉线!
由以上检测办法可以看出,Win2000服务器版的集群服务在容错方面具有良好的表现!一般在瞬间即可把出错的节点上的服务接管过来,而用户端并不会感觉有明显的变化!

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/70914/showart_727680.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP