免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1561 | 回复: 0
打印 上一主题 下一主题

中国各行业“业务连续”应用现状与需求分析 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-03-30 13:50 |只看该作者 |倒序浏览
一场突如其来的SARS危机使各行各业的人士更加体会到了信息技术的重要,大家突然意识到,有时候我们不得不改变那种沿袭已久的“集中式”办公模式,而正是拜信息技术之所赐,我们在“分散”甚至“隔离”的情况下还能使正常的业务得到连续。信息技术的发展使整个社会愈来愈走向“分散化”和“非接触”,而“分散化”和“非接触”又反过来对信息技术的应用提出了更高的要求——今天你能够做到业务连续(Business Continuity)吗?
  要想明确回答这样的问题是非常困难的,在此我们不妨首先把视角转向中国的行业企业。毫无疑问,行业信息化代表着我国IT技术应用的最高水平,为此,我们结合BC的内容和需要,从系统、通信、数据等多个层面,设计相关几十个问题,对于主要行业现状进行了专项调研,掌握了第一手资料。
银行业
  商业银行总行的服务器备份大多是热备份(如双机热备份),分支行除了主要服务器,多数是冷备份。主机和服务器系统有时会遇到一些硬件故障,通常是服务器主板和硬盘方面的故障。
  对于电力供应都非常重视,采用UPS,而且很多是冗余UPS。
  银行的软件要通过完备的测试才能投入生产,所以对软件的测试很重视,这在银行业是非常统一的。软件系统出现故障的机率较小。相较而言,还是WINDOWS系统出的故障多一些,还有就是在系统升级、程序补丁中出现一些问题。严重的人为错误操作会影响系统的的正常运行,所以银行机构一般是通过一些管理制度和技术措施来避免和减少误操作。
  基于Java的软件兼容性很好,其他语言的应用软件经过移植也可以有较好的兼容性。能够明确确认哪些应用/哪些功能属于关键的应用和功能,银行的核心业务系统及其外围系统都是关键应用。
  电子邮件极大地提高了工作效率。邮件记录丢失不会受到影响,重要邮件则会有备份。
  一旦出现软硬件故障后,根据故障级别,通常恢复故障时间在0.5~4小时。
  数据库可以重新组织,数据仓库在有些银行的分行正在进行建设,一些银行的总行也在进行数据仓库建设。
  网络大都已经采用冗余设计,总行到分行的通信线路采用三重备份,分行以下的通信线路至少是双重备份。备用电信线路在主线路故障时会自动被激活,一般使用备用线路的频率较低。银行的网络系统通常会采用防火墙、入侵检测、漏洞扫描以及病毒防护方案等多种保护措施,效果很好。网络安全和系统安全是银行业务运行的基本要求,银行对安全的要求很高,投入也很大。银行的网络系统一般都可以实现全程网络管理。
  银行基本能够掌握全部IT设施的详细资料,包括:硬件型号、种类、配置、软件版本、许可证、本地以及远程数据、应用的分区情况、安全访问途径、操作方式、系统可靠性等。
  各个商业银行的数据备份策略各不相同,有的银行备份数据具有等级区分,重要的数据进行0级备份,有的银行备份数据不分区,数据完全备份,按日期检索。
  所采用的数据备份方法:SAN、磁带、硬盘均使用,主要的存储设备均采用RAID技术。重要文件均建立了备份。重要数据(本地)有备份。可以重建。银行普遍建有数据备份中心,目前以本地的备份为主,异地备份中心较少,异地备份大多是一天或更长时间段的批量备份。目前,许多商业银行的总行正在准备建立异地实时的数据备份中心。
  银行定期进行恢复测试。重要应用有应急测试,通常要求1小时内恢复。没有发生过磁带备份错误。
  银行系统大都知道业务连续性(Business Continuity)的概念,并且认为BCP非常必要。银行都有明确的应急策略计划,人员也有明确的分工。设有应急领导小组决定管理层应急状况下明确人员分工。有临时办公地点,能够保持分机号码不变。
  在银行系统内,除了必须面对面的交流和实物的交接之外,其他的工作均可以通过远程办公进行。但是,在远程办公环境下的绩效考核可以通过数字化和量化考核体系的建立或手工方式。
  目前开展远程办公最主要的障碍是人的意识的改变、激励机制的设计和业绩考核,还有就是安全问题。目前,许多商业银行已经建立了总行级的视频会议系统,或是正在建设中。
  此次非典对银行最主要的影响是技术支持服务质量难以保证。在业务上主要采取了轮岗上班的措施。
  从安全角度上考虑,大部分银行没有采取远程办公。少数银行演习了关键人员的远程办公。非典时期主要通过邮件和电话与客户和合作伙伴沟通,很多银行的总行采取客户准入制度以保证设备和服务质量。
  银行业商机:
  从调查状况来看,银行业在总行一级对BC方面的准备较充分,除了对设备和系统的备份,还包括对各种灾难恢复的机制建立,模拟灾难应急的演练。但银行的数据中心规模较大,其灾备中心的建立很复杂,投资也不小,很多银行正在考虑之中。在国内一些IDC如能取得银行的信任,成为银行外包的提供商,将产生机会。
  银行的分行对BC的重视程度很高,但在具体应对时水平不一,有些银行的软件、硬件也需要更新和加强。
证券行业
  证券公司的服务器分为交易服务器、行情接收服务器、后台办公服务器、数据库服务器,其中交易服务器和行情服务器对稳定性的要求非常高,要求不间断运行,一般会使用双机热备份来保证,行情接收是通过证券公司与交易所之间的卫星通信来实现,除卫星之外通常还会有拨号网络做备份。
  证券公司使用的服务器品牌较多,其中以原康柏公司的IA架构服务器居多,近年来IBM和HP的UNIX服务器逐渐增加。证券公司的网络系统至少有一个备份线路,也有许多公司会有2条备份线路。在营业部与交易所直连的网络结构下,营业部与交易所的通信最为重要,营业部与总公司的通信一般是非实时通信。在营业部通过总公司与交易所通信的网络结构下,营业部与总公司之间是实时通信,需要实现全程网络管理,总公司要对与下属各营业部之间网络通信质量进行管理。
  由于对系统不间断的要求很高,证券公司的电力系统很完善,通常每台主要的服务器都有UPS,中户室、大户室的电脑都有UPS系统,散户大厅的电脑和行情显示屏也会根据终端的数量平均几台共享一个UPS。在一些实施或准备实施集中处理的证券公司,其中心机房采用多回路供电系统。
  证券公司的业务软件以前主要是基于WINDOWS平台开发,软件故障时有发生,近几年一些证券公司开始采用UNIX平台软件,软件故障趋于降低。证券业务软件对稳定性要求极高,因此测试很严格。数据库可以重新组织,数据仓库在有些证券公司总部级已开始应用。
  证券公司大都知道业务连续性(Business Continuity),并认为BCP是非常必要的,业务连续性对于证券公司是基本的生存点,如果在交易期间系统停顿,可能带来极大的损失。所以,证券公司都有明确的应急策略计划,人员也有明确的分工。
  证券公司聘请顾问咨询公司做战略咨询的很多,由于技术人员的缺乏,一般都有外部技术支持和技术外包这样情况,外包服务商了解本系统详细情况。
  对证券公司而言,业务中断的风险是可以评估的,但损失无法评估。在紧急状况下,可以通过电话、手机、电子邮件、客户经理与用户沟通。数据备份一般实时性不高,很多采用的是在每天交易时间以后,进行数据备份,如将数据通过网络备份到总公司,本地的存储结构多以NAS为主,主要使用磁盘阵列。
  证券公司一般没有远程办公系统。
证券业商机:
  证券业对BC的认识程度很高,也有相应的措施,大致可以分为两种情况,一种是构架在WINOWS平台之上的系统,对于BC还有很大可完善的空间。另一种是构架在UNIX系统上,逐步走向数据集中、处理集中的方式,将产生较大的采购需求,其中不乏对BC方面的投入,而且证券业的数据集中后,对异地灾备系统的需求会很高。
保险行业
  在非典时期,各个行业都出台了相应的应急策略,保险行业也不例外。与其他行业不同的是,保险行业在非典期间的业务都有显著提高,特别是非典专项保险设立以后,业务量更是异常饱满。对公司本身来说,这的确是好事,不过对保险公司的员工来说,如何在SARS流行的时候更好地保持日常业务的连续性,这就成了一种考验。其实SARS只不过是一个特殊时期的缩影,每逢一些重大灾害发生,保险公司门口都是大排长龙。所以说,别人都放假了,保险公司也不能放假,这次的SARS恰恰证实了这一点。
  对保险公司而言,其核心业务系统是整个公司日常运营的基础,投保、审核、理赔、存档等等一些列服务都要在核心业务系统上完成,而搭载核心业务系统的服务器主机系统则是整个公司的心脏,服务器主机系统必须7×24×365的不停运转以保证公司的正常运行。因此,保险公司内部服务器主机系统的安全与业务连续则成了此次保险行业BC调查的重中之重。
  在参与调查的15家保险公司中,只有两家发生过系统故障,占总数的13%,而且也多是集中在一些外部设备,如网卡、软件等,主机自身的故障几乎没有。不过有点意外的是,有些刚刚开业的小公司本身还没有添置主机,而是用服务器集群的方式运行核心业务系统和数据库,当然前提是数据量要小。不过这也只能是节约成本的暂时方案,毕竟服务器和主机的可靠性不能同日而语。
  为了应付突然断电,所有的保险公司都采购了UPS,支撑整个机房1到2个小时的电力供应都没有问题。不过,目前各个保险公司还都没有采用可以进行在线替换的热备份系统,主要原因一是保险公司本身的IT投入还比较有限,距离银行、证券还有较大差距;二是保险公司本身对于数据的实时性要求并不高,毕竟保单一时没有进入系统也不会造成很大影响。不过凭借服务器主机系统的性能,15家保险公司都实现了负载均衡。
  从保险公司租用专线的情况来看,由于90%的保险公司都在进行大集中的工作,甚至5%的公司已经完成了集中,集中后服务器主机系统都放到了总公司,因此各地分公司的前置系统需要通过专线和总公司的服务器主机系统相连。这个过程中电信提供的专线线路就成了总公司和分公司进行交互运作的生命线。
  如何在集中模式下保护好公司的生命线,这的确是保险公司运营的关键。目前约有65%的保险公司都采用了基础网络的冗余设计,在和总公司连接的专线上也都采用了线路的冗余。一些大保险公司往往采用4到5条的冗余线路,而小保险公司一般是采用一条专线加若干ISDN或拨号的方式,力求最佳的性价比。在专线的选择上99%的保险公司都采用了DDN线路,只有一家公司使用了FR方式。
  截止到目前,15家公司的线路都比较稳定,备用线路激活程度很低,不过这只限于大城市。一些小城市或者地级市的效果还不能保证持久的稳定。另外,约有20%的保险公司采用了全网的远程管理,相对而言绝大部分保险公司的动作还显缓慢,主要还跟各自的基础结构复杂程度有关。
  从灾难备份的方面来看,15家保险公司都可以掌握公司全部IT设施的详细资料,包括:硬件型号、种类、配置、软件版本、许可证、本地以及远程数据、应用的分区情况、安全访问途径、操作方式、系统可靠性等,这就为灾难备份的开展打下了基础。
  目前各个公司都采用对数据分月备份(全备份)和日备份(增量备份)的做法,让人意外的是,15家保险公司都没有进行在线双机热备,最多是提供一台备份机。各家公司的主要方式还是在主机后面附加RAID存储,而后倒入磁带的做法,而所有的磁带也统一存放在银行的保险柜里。这种情况从当前来看还是有一定性价比的,而且也比较容易实施,不过缺点就是恢复的时间太长,而且只能保持一天的数据一致性。
  当前有少部分保险公司在进行NAS或SAN的尝试。这两种方式都克服了传统的磁带备份的不足,比如恢复时间长、数据一致性差等,不过两者的缺点也是明显的,投入比较大,而且需要专人维护,费用也高出很多,不过这是今后的大方向。
保险行业商机
  从调查结果来看,保险行业在BC方面做的还算成功,主机系统、电信线路均比较稳定。不过国内各家保险公司的主机系统多为小型机,个别业务量小的公司甚至用服务器代替,而目前市场上对保险的需求却是全线飘红,这势必会造成服务器主机系统处理能力的不足,刺激保险公司更换处理能力更强、系统更加稳定的大型机或热备系统。另外,传统的磁带备份正在受到NAS、SAN的冲击,而保单需要超长时间存储的特点也将拉动对存储的大量需求。而在远程管理上,15家公司几乎异口同声地表示需要,并希望厂商能够进行一些额外的帮助,这也应当引起厂家的重视。
政府部门
  政府机关因其工作性质的重要性,对信息系统的安全、稳定和可靠性能一向要求很高,并采取了较好的技术手段来应对各种突发事件。在此次“非典”特殊时期,政府机关的业务并没有受到多大的影响。
  在所调查的政府机构中,服务器主机系统基本没发生过大的故障。但也曾经发生过一些局部和小的问题,系统基本上采用了冗余设计,实现了在线切换和磁盘备份,但有30%的机构表示没有实现负载均衡。为了应对临时断电,基本上采用了UPS防护,有的实施了双路供电措施。服务器则处于100%的运转状态。
  在软件系统方面,总的来讲,没有出现过系统崩溃这样的大问题,有一家反映其XP系统曾出现过不能正常启动的现象,且一些防病毒应用软件也曾出现过问题,但并没造成很严重的后果。应用软件的平台兼容性良好。有20%的政府机构反映,由于业务的特殊性需要,他们的一些应用软件都是由自己内部来开发。政府机关的信息管理部门人员的专业素质相对较高,基本上不会出现因人为操作错误而导致系统不能正常运行的现象。
  被调查的政府机构都设有自己的邮件服务系统,而且他们都认为邮箱对工作的效率有比较大的影响。有个别机构反映其邮件系统不好用,这种状况已经持续了一段时间,但是何原因尚不明了。
  调查中得知,这些机构都有多套电信接入方案,而且备用线路使用还较为频繁,一般在需要更快的网络速度的情况下就会使用备用线路。有的机构因为其主线是卫星系统,所以在天气不好的情况下就会使用备用线路。
  数据仓库技术的应用还不算普遍,只有两家机构表示正在建设数据仓库。由于工作具体业务性质的不同,有30%的政府机构表示经常对软件进行测试,他们专门备有机器用于软件的测试,所以软件测试工作不会影响到系统的正常运行。
  在灾难备份方面。被调查的机构表示基本能够掌握全部IT设施的详细资料,包括:硬件型号、种类、配置、软件版本、许可证、本地以及远程数据、应用的分区情况、安全访问途径、操作方式、系统可靠性等。具体的数据备份方法则大同小异,主要的方法有:SAN、磁带、硬盘均使用,主要的存储设备均采用RAID技术。对重要文件均建立了备份。员工本地文件则大多用光盘备份。
  对于业务连续性(BC)的概念,大部分调查者表示有不同程度的了解,他们认为BC对业务的正常运作很重要。但是调查显示,对于如何处理紧急状况,一部分机构还并没有一个明确的应急策略及人员分工,也没有安排临时的办公地点。
  在此次“非典”期间,有80%家采取了在家办公或轮流办公的方式。由于认识到远程办公的重要,有20%家机构表示有购买视频会议系统的意愿。
政府部门商机:
  相对来讲,政府机构的信息系统建设水平应该算是比较先进的,因大力提倡电子政务之故,政府机构的信息化建设现在还处于一个快速上升的阶段。政府机关的信息部门对BC的重要性有着一定程度的认识。从本次调查来看,政府机关基础的网络系统配备比较健全,但是在网络存储能力和系统稳定性方面还有进一步提升的空间。另外,在数据仓库、视频会议等新的应用上应该有着一定的需求。
电信行业
  电信行业是为数不多的BC业务准备比较充分的行业之一,在我们的调查中,尽管80%的电信运营商并不知道什么是BC,没有听说过这个舶来的名词,但这并不等于说电信行业对于BC没有准备,如果用一个可以量化的数据进行评判的话,90%的BC相关业务,电信行业都进行了精心准备和部署,在国内行业企业中居于领先地位。如果说稍有不足的话,几乎90%以上的运营商没有进行过全面数据恢复的实战演练,也就是说,尽管电信行业对于灾难具有精心准备,以及数据方面的全面备份,也具有紧急情况下的应对措施,但是没有定期的演练。这有点像消防队,具有扑灭烈火的能力,有战胜灾难的把握,但是缺乏必要的消防演练。
  从我们所了解的情况来看,在电信行业内部采用了多种服务器和主机系统,这些系统根据任务的不同,具有不同的设计,有些系统具有冗余设计、负载均衡能力,有的系统具有在线切换的能力,总之是根据其任务性质,具有不同的可靠性设计指标。从以往实践来看,没有发生因为主机系统故障影响到电信业务的畅通。特别值得一提的,电信作为国民经济敏感性行业在断电防护方面具有超强的防护,从两路市电、柴油发电机、UPS、蓄电池、移动柴油机、移动发电车,电信基本可以做到万无一失。这个调查结果基本可信,日本阪神大地震发生的时候,唯一对外保持畅通的通信方式就是Internet,这说明电信行业的BC业务水平比较高!
  此外,电信行业的服务器具有必要的计算能力设计,CPU没有处于100%高负荷运转水平,具有必要冗余。
  从软件的使用情况来看,电信行业多采用专用的系统,这些软件进行过专门化的应用测试,没有发生过系统崩溃的现象。电信行业内部,不同的业务部门内部,对于关键的业务应用和功能具有明确的划分,对于紧急状况下的业务恢复具有明确的要求,没有出现过因为人为操作失误导致系统崩溃的问题。目前,邮件在电信行业内部普遍应用,个人涉及关键业务的邮件都在一台公共的机器存有备份,而系统管理员,业务员都配有笔记本电脑、U盘,谨防数据的丢失。在电子版出现问题的时候,根据业务需求,有响应的传真、书面的调令进行配合,时间不容许的情况下,负责人可以通过电话颁布命令,响应的电话都具有确认和记录。
  关于通信链路的可靠性方面,电信是服务的提供商,承担着普遍提供电信接入的任务,在可靠性方面自是重视非常,防火墙、入侵检测、漏洞扫描、病毒攻击等这些在企业都得到普遍应用技术,在电信行业更是得到了超常规的采用。而全网管理是最基本的要求,至于备用电信线路问题,去年以来频繁出现的海底光缆被渔船鱼网挖断的问题,影响到了通信的畅通,加重了其他线路的负担。但没有因此发生通信完全中断,随着相关法律条令的出台,通信畅通问题会得到一定保障。为防止意外的发生,运营商之间都租用了第三方线路。
  在数据备份方面,我们所调查了解的服务提供商中,没有不能够掌握全部IT设施详细资料的情况,不仅能够区分数据的重要等级,更进行了全面的数据备份。从异地备份情况来看,经常是北京-上海等大城市之间互为备份,从地理位置上足能够保证数据的安全。在一个城市内部也具有备用的办公地点。经过此次非典事件的影响,运营商纷纷开始加强第二运营中心的基础设施水平。例如中国网通已经开始加强其上海中心的设备水平,使其达到与北京相同的技术水平,在紧急状况下接替北京的任务和角色。
  此次“非典”对于电信行业也有不同程度影响,员工因为不能够上班,导致通信成本上升,在非疫区基本没有任何影响。CEO等管理人员与员工的沟通方面,主要依靠视频会议系统,其次是邮件、电话。这真是近水楼台先得月。
<span style="FONT-SIZE: 10.5pt; LINE

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/1337/showart_18515.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP