免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1347 | 回复: 0
打印 上一主题 下一主题

[容灾] 容灾中心的建立 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-05-14 11:36 |只看该作者 |倒序浏览

随着计算机、网络技术的发展,计算机系统对于企业的经营活动的支撑作用越来越明显。而这些信息系统,又常常面临各种不同的威胁,如服务器的故障、网络故障和地震等自然灾害。因而,容灾备份中心已经成为不少计算机系统的基本组成部分,特别是在银行、保险、电信等行业目前已经建立了一套非常复杂的业务运营支撑系统,几乎所有业务都要通过这套计算机系统来完成,容灾备份中心的重要性更是不言而喻。
建设容灾中心面临的困难
容灾备份是指利用技术和管理手段,确保在灾难发生后,企业计算机系统的关键数据、数据处理系统和业务可以恢复的过程,其最终目的是保证在灾难发生后的指定时间内恢复既定范围的业务。容灾备份是一个很复杂的系统工程,这种复杂性表现在:
1.多网并存。许多企业建设了众多的业务系统,这些系统运行在各种网络基础设施上,如税务系统工作人员通过广域网(电信公网)或局域网与中心系统连接,网络包括内网、外网、发票税控管理网、数据交换网等多种。
2.用户多样。计算机系统往往不仅要为企业内部工作人员服务,还会为与企业相关的外单位人员服务,为企业服务对象服务。
3.应用系统运行模式多样。企业既有客户端/服务器结构的两层架构系统,也有客户端/ Web服务器/应用服务器/数据库服务器/海量存储系统的N层架构的应用模式,同时还有单机模式。
4.大型系统还有一系列的安全防护设施、负载均衡调度服务等。
基于这些特点,容灾备份中心必须仔细规划。另外,在容灾备份中心方案设计中还有几个关键的技术问题要把握:
1. 容灾系统启动时机。对整个信息系统来说出现什么情况认为是灾难发生,在什么前提下,才启动容灾中心,启动容灾中心是自动切换还是人工处理,切换到新的备份系统时,整个系统如何协调启动工作,保证整个系统的正常运转。
2. 容灾系统建设级别。容灾备份中心是建立在何种层次上,如是数据级备份、还是应用级的在线备份。如采用应用级备份,应用系统的容错处理是否能满足需求。
3. 容灾系统建设内容。大量用户通过广域网与核心系统连接,这样容灾不仅要考虑核心系统的容灾,同时还有通信网络的容灾技术方案。
4. 客户端透明连接。不同用户在灾难发生时,如何与计算机系统连接等。
容灾中心系统建设步骤
由于容灾中心的建设是一个复杂长期的过程,所以我们应该循序渐进、统一规划、分步实施。建议先考虑数据容灾,再考虑应用容灾,先关键系统容灾,再非关键系统容灾。容灾工程的基本顺序是:设计、施工、检验、调整、编制应急方案、应急方案的演练、维护。具体步骤如下:
1.数据异地容灾
容灾中心首先要保证数据的容灾,并保证其完整和一致性。两地数据的同步要综合数据的类型、冗余情况、线路带宽、运营成本等因素综合考虑。
2.最核心业务应用容灾
在数据容灾的基础上,营销、账务、电信计费和银行结算系统、电信HLR接口系统等非常重要的系统进行应用级别的容灾。
3.次核心业务应用容灾
在核心业务容灾基础上,对于客服系统、计费采集系统、营业接口系统等次核心业务进行应用级别容灾。
4.外围系统容灾
在各个核心业务应用容灾的基础上,对于接口系统、资源管理系统、与ICP接口增值系统、OA系统、财务系统等外围系统实行容灾,保证系统能够快速实现自动接管。
实践中,采用以上四步走的策略时,尽量在保障生产节点业务不中断的条件下,逐渐建立起容灾节点。
容灾系统网络建设
在目前技术条件下,根据生产中心和容灾中心的不同的距离,业界有不同的网络建设方案。
一般来讲,异地容灾两地距离越远,对地震、水灾等灾害的容灾效果越好,但实现的难度和代价就越大。长距离情况下,高速数据交换所导致传输延时将变得不可忍受。两地数据同步传送情况下,不管是生产系统,还是容灾系统,性能将急速下降。目前为实现实时数据交换,数据同步的应用级别的容灾距离一般不超过100公里。
异步方式在两地之间的数据传送比较灵活,容灾距离可以长达数千公里。但一旦灾难发生,两地数据容易出现不一致的现象,企业要做好准备忍受少量数据丢失所造成的损失。目前超长距离的远程容灾一般采用中继接力加异步处理的办法,在生产中心和容灾中心两端沿途设立一系列的节点。此方案的成本较高,技术难度也较大。目前比较常见的选择是在100公里的范围内,这样可以采用比较成熟的IP和SAN容灾方案。
1.IP组网
企业的业务支撑网是相互紧密联系的。如果两地有光纤资源,采用广域局域网技术组网,
将比通过路由器组网要高效得多。局域网内速率可高达1Gb/s,完全可以满足两地IP通信对带宽的要求。另外,可以通过组成环或者双机双线路提高整个网络的稳定性和高可用性。采用路由器通过广域网互联,由于采用STM-n线路,会增加技术复杂度和投资。
IP局域网互联有两种方案:一种是采用局域网两层交换技术实现互联,通过VLAN 的路由控制;另外一种是通过两层以上的协议——RPR弹性分组环实现互联。两种方案两地之间的最大光纤距离一般都不超过70公里。
两层交换方案具有投资少,网络效率高,集成和维护简单的特点,但VLAN太大容易造成广播风暴。RPR环方案能够很好抑止广播,具有很好的链路层安全保护特性,环网自愈保护倒换时间小于50ms,但是投资较大,集成和维护较复杂。
2. SAN组网
备份如果属于“大容量数据块拷贝”和“顺序写”操作类型,采用SAN组网实现容灾节点对生产节点的备份是最佳选择。
SAN的Fabric内部组网最大距离可达20公里,超过100公里一般使用SAN网桥(CNT产品),将SAN信号转换成ATM,或者通过波分与远端SAN互联,速率将会受网桥的限制。FCIP技术的提出将使得它成为通过IP网络连接SAN的一种标准方法,它将取代SAN网桥实现两地的互通。
采用FCIP最大好处是可以克服Fiber Channel 的距离限制,并可以通过传统的路由器传送SAN 的帧。
可选的数据备份技术
容灾备份中心建设中最关键的环节应该是数据的异地备份,因为应用的备份也必须以数据备份为前提,而且只有数据才真正是用户的核心积累,是最不能丢失,也不易恢复的部分。目前实现数据异地实时自动备份的解决方案有以下三种:
1. 基于存储硬件实现的数据实时自动复制
此类技术的特点是基于特定的存储阵列产品,利用专用接口和专用软件实现。一般要求数据复制的源和目的地有相同的磁盘阵列产品,且两点之间通常采用光纤连接,运行FC、ESCON或其他专有协议。典型案例如IBM基于ESS的PPRC技术,EMC基于Symmetrix的SRDF技术,HDS基于Lightning 9000系列的TrueCopy技术等。
此类技术的优点是:
● 基于存储设备实现,对主机透明,故对主机资原占用极少;
● 两地之间的数据传输带宽很高,一般能达到10~100MB/s,延迟很小;
● 完全的磁盘之间块级拷贝,与上层应用无关。
此类技术的缺点是:
● 投资大,实现困难。因一般要求两地(生产中心和容灾中心)之间必须有光纤连接(Fiber Link),或采用裸光纤,或在两地加载DWDM(SAN环境下)或ESCON设备,以上条件对于非电信运营商很难实现;
● 容灾中心之间受距离限制。一般超过100公里后,技术实现难度和投资都将非线性增长;
● 灵活性差。只能实现单纯的数据复制,不能提供应用系统级的容灾切换。
● 开放性差。只能实现同构系统的数据复制。
● 两个系统只能是主备,一个系统运行,另一个处于停机状态。
2.基于系统平台级的数据实时自动复制
此类技术的特点是在特定的系统平台(不依赖于数据库和磁盘阵列硬件)上,基于相同的卷管理技术(如IBM JFS或JFS2,Veritas Volume Manager)实现的异地数据复制技术,典型案例如IBM 的GeoRM,Veritas的Veritas Volume Replicator。
此种技术的优点是:
● 灵活的基于卷组的复制技术,对数据库数据和非数据库数据透明,对上层应用透明;
● 基于开放的IP网络的数据传输,设备、线路投资小,没有距离限制,易于实施;
● 与操作系统结合,在数据复制的基础上,上升到应用系统级的自动切换;
此技术的缺点是:
● 涉及到操作系统存储管理技术,规划和实施有一定技术复杂性;
● 基于IP网络传输数据,相对于基于磁盘阵列和基于FC数据链路的传输技术,其数据带宽利用率较小,延迟较大。
● 系统开发性差,一般在同构系统之间实现,否则会增大系统实施难度。
● 系统数据库处于非活动状态,平常容灾中心不能分担生产中心的工作。
3. 基于数据库的数据实时复制
此类技术的特点是基于特定的数据库平台,通过数据库内部机制,实现局域网或广域网范围内的数据复制,典型案例如Oracle的Data Guard,Sybase的Replication Server,DB2的 DataPropagator。 此类技术的优点:
● 可以在数据库内定义更细粒度的数据复制策略,如指定表、行、列等;
● 容易实现数据库级的自动切换;为系统自动切换打下基础
● 基于开放的IP网络的数据传输,设备、线路投资小,没有距离限制,易于实施;
● 能实现异构系统之间的数据复制,保证系统开放性;
● 数据库处于活动状态,容灾中心数据库在实现容灾功能的前提下,可以分担一部分生产中心的工作
此类技术的缺点:
● 只能对存放于某一种数据库中的数据进行复制,而对非数据库数据无能为力;
● 不能与应用系统的切换结合。
以上三种技术中的每一种数据异地实时复制技术都有其优缺点,适合于不同的用户环境,具体实现何种容灾方案,建议用户针对系统的现状和容灾系统的建设目标而定。
容灾中心的管理
容灾中心建设以后,为了能够保证效果,在生产系统改造和扩容时,都要重新对安全策略进行审查,以保证需要的时候容灾处理能顺利实施。一些系统,如决策支持系统,在规划或者扩容时,可以考虑在容灾中心的数据上进行读取的操作,以减少对生产系统的影响。
另外,还有一点要特别注意:容灾中心建立后,虽然极大提高了电信企业抗地震、火灾、水灾、人为破坏的能力,为企业的稳定发展买了一个“保险”。不过,这只是一个表面上的保险,要真正起作用,容灾中心的日常维护管理工作必不可少,这包括:
● 为保证人员的灾难应对能力,需要制定完备的灾难应急措施。
● 需要定期通过演习检验容灾系统的可用性和操作人员的应急处理能力。
● 应用软件、系统配置等相关数据都需要在生产系统和容灾系统进行分发和维护。



本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/68913/showart_687654.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP