免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 705 | 回复: 0
打印 上一主题 下一主题

[容灾] 金融行业‘震痛’后的灾备建设处方 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-13 13:54 |只看该作者 |倒序浏览
金融系统的IT系统不仅承担着对公、储蓄、增值业务、账户管理系统、征信等关键业务的运营,而且具有各类扩展业务、OA、数据、决策支持等各类支撑子系统的运行,系统的不间断运行能力对于维护和谐社会、提供优质服务、进而在激烈的市场竞争中立于不败之地具有极其重要的地位。而确保核心业务系统能够持续运转的核心就是建立强大的容灾体系以抵御、防范各类风险。目前,各商业银行已经将灾难备份的目标提高到很高的层面,而且在业务恢复的等级上都具有在各行业中比较高的恢复指标,这些灾备标准往往涵盖极小的数据丢失指标和极为快速的业务恢复能力指标。
技术定位及采用对于灾备体系的成功,起着极其重要的作用。为了满足全面的灾难防御要求,实现高标准的灾难防御指标,同时避免出现国内常发生的容灾备份体系建设之后,仍出现“有灾无备”的现象,美国飞康公司所提出的基于IPStor技术的CDP(连续数据保护技术)灾备方案,往往能获得高效、全面、高标准的新的灾备标准
美国飞康公司是国际上知名的虚拟存储技术软件公司,最早成功地将虚拟化技术结合数据连续保护及存储优化等领先技术,提出了功能强大、开放、性能出色并面向未来发展的CDP灾备解决方案,不仅实现大型灾难的业务恢复体系,而且实现了各类人为错误的瞬间恢复机制,这使得用户由单一技术同时解决硬件故障和数据逻辑错误的愿望变为现实,这在各类容灾技术中是非常独特的
目前在各商业银行的业务系统中,IT系统所受到的威胁不仅是各类自然灾害等大型的站点级威胁,更多的则是来自于系统内部的各类自身运行威胁。例如:
存储单元的保护缺失:虽然已经建立了基于集群方式的高可用集群,但这一体系只能解决主机系统的安全问题,存储系统本身的安全性还是一个比较薄弱的环节,一旦存储系统故障,双机体系则立刻失效,业务系统可能出现停止运行的情况。
历史数据版本的瞬时备份及恢复:一旦出现数据丢失或系统受到破坏,采用传统的备份系统无法帮助管理人员立即恢复到正确的状态(RTO时间过长),应急能力极弱,同时存在数据不可恢复的风险。因此,备份、恢复的各项指标急需进一步提高,特别是数据备份的实时性亟待提高,以提高对数据安全的保障能力。目前,虽然各类信息系统都建立了备份系统,但是根本无法对这类常见故障提供及时和快速的恢复和应急机制。我们经常可以见到一旦数据库系统因故障停运,其对于整个系统会产生巨大的杀伤力。
有些人认为,采用传统的灾备方式,也能立刻化解以上各类风险。事实如此吗?其实不然,传统的灾备方式在这类常见的“杀手”面前,完全束手无策,因为他们忠实地实现了一个标准的机制,而错误也在传递和克隆,错误仍会杀伤到灾备中心。
美国飞康公司的IPStor CDP容灾方案,是专为金融领域的IT系统设计的一套行之有效的,集磁盘镜像、数据备份、数据远程容灾于一体的多点综合容灾解决方案。其基本架构为:
1.在各生产中心配置一台IPStor CDP数据保护管理器,通过FC/iscsi方式连接到现有的生产数据库服务器上。这一连接不影响生产数据的原有路径,不影响原有的磁盘阵列连接。
2.IPStor CDP数据保护管理器,均通过数据抽取工具实现生产盘到IPStor CDP的Mirror机制,实现生产数据的同步提取。
3.生产中心的IPStor CDP数据保护管理器配置256份快照/生产卷的快照模块(TimeMark),实现多历史点保护。
4.生产中心的IPStor CDP数据保护管理器将提取的生产镜像盘通过Replication的机制实时复制到远程容灾中心。
5.远程容灾中心设立一台IPStor CDP管理器,连接到容灾中心的磁盘阵列上,与生产中心实现数据的传送。容灾中心的IPStor CDP数据保护管理器同样配置256份快照/生产卷的快照模块(TimeMark),实现多历史点在容灾中心的保护。
6.远程复制的策略根据实际的传输带宽情况灵活制定。带宽充裕则可以设定为连续模式(同时可配置成为时间间隔的快照方式,通过时间间隔在远程形成照相点,采用TimeMark模块),带宽较窄则建议采用时间间隔增量的方式进行。
7.故障时,如需灾难恢复,只需提升容灾中心IPStor的对应空间即可。
8.如果生产系统出现人为的错误,需提取数据进行查询或纠正错误,只需对远程对应的快照瞬间可用即可(这一过程5分钟即可完成)。
9.美国飞康提供了两端磁盘系统的差异比较机制,容灾系统随时可以进行各类容灾备份演习,比如利用容灾中心启动验证某类业务接管后的正确性,并且在容灾备份演习结束后进行各种方向的还原(如容灾备份系统同步生产系统或生产系统同步容灾备份系统等),具有很大的灵活性。
飞康公司的CDP 本地/异地数据保护系统的设计思想将容灾系统建立在一个更高更完善的层次。设计目标和效果涵盖以下方面 :
灾备系统防御范围涵盖“软”“硬”等灾难种类
信息系统在运行过程中可能出现的故障和危险主要存在以下几类:
* 主机系统故障
* 存储系统故障
* 数据库系统无法启动/数据库表丢失/数据库文件丢失
* 文件丢失
* 人为导致的系统错误(如黑客、数据删除等)
* 计划内系统升级
* 自然灾害、设施故障、停电等 针对主机系统的故障,如果配置了双机热备系统,往往能够实现一定程度业务连续。但是,存储系统的故障将使这一切努力化为乌有。根据国内各行业尤其运营商的历史统计,存储系统故障导致应用宕机的情况往往经常发生。因此,容灾体系建设中,存储系统的安全性保障及灾难方案是重中之重。飞康新型CDP灾备解决方案,首先做到了针对存储设备的致命故障确保业务立即运行,使系统具有对存储系统故障的免疫能力。
需要强调的是:常规容灾建设中,往往只关注硬件故障或基础设施部分的故障概率,忽略了发生概率很高的数据丢失以及人为失误造成的破坏,使“有灾无备”的现象屡屡发生。实际上,传统容灾技术手段均忽视了这类“软”错误的防范。
例如:当生产中心错误发出一条删除指令时,容灾中心的数据也将被删除。
常规容灾技术此时只能利用传统的备份手段来恢复,而您可能不得不面对长时间的系统恢复、部分数据不可恢复的风险、复杂的恢复过程等诸多不利因素。
因此,飞康新型CDP灾备解决方案将同时解决“软”、“硬”两类灾难作为整个系统设计的第一目标,完全克服了各类传统容灾备份体系的这一弱点,保障业务的连续运行、提升系统安全。
容灾和备份的一体化解决方案
常规容灾系统建设中由于技术的局限,大量采用容灾复制的方式再追加传统的磁带库备份方式,这种组合方式考虑到了对各类灾难的抵御,但由于传统备份软件和设备的限制,以及其无法按照灾备指标进行衡量的弱点,使用过程中多不理想。
飞康新型CDP灾备解决方案即将容灾与备份合为一体,确保在任何灾难(包括数据损坏需要恢复历史数据时)发生下的快速恢复能力,在灾备理念上达到了一个新的起点,保障了方案的创新性和先进性。
开放式容灾系统,无硬件等技术限制
这一条件使得用户在设备选型时拥有了完全的自主权,能够大大降低设备的采购成本,不会再为不可选择的专用设备的高成本而发愁了。
有效保护OA系统
针对OA系统的灾难保护体系,是一个十分令人头疼的事情。生产系统的灾备体系往往无法延伸到OA系统的保护层面。目前,各商业银行中,OA系统的防护仍停留在备份的比较落后的层面上。美国飞康公司的CDP容灾方案针对OA系统的防护提出了专门的解决体系,这就是任何邮件服务的损失在5分钟内实现恢复,OA服务器的瘫痪,在5分钟内重新运行。这几个关键点的出现,彻底打开了OA系统防护体系的大门,使得灾备技术出现了飞跃。
针对数据库的数据一致性保障机制

数据库系统的容灾备份体系中,不仅要同步存储的数据块,而且数据库高速缓存中的数据必须与数据库文件的数据保持一致性刷新。以上所有内容均完成远程同步后,才能确保灾备站点的正常一致性启动。
常规容灾技术分类中均无对高速缓存数据的处理机制。飞康新型CDP灾备解决方案提供的数据库代理,确保了数据库的快速恢复和一致性,在技术上具有相当的先进性。
灾难发生时的极快速恢复能力(RTO)

恢复能力的高低是容灾备份体系的重要指标,具体体现在重要的RTO指标。只有快速的对于各类故障的恢复,才能够确保业务的持续运行。飞康新型CDP灾备解决方案的一个核心思想就是瞬间恢复的理念,将恢复的能力提升到一个很高的高度。体现在:
* 生产中心础设施故障,容灾中心启动飞康专用设备,业务恢复时间

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/71105/showart_1000302.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP