免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1325 | 回复: 0
打印 上一主题 下一主题

[容灾] NetApp综合存储灾难备份解决方案 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-05-09 10:01 |只看该作者 |倒序浏览
作为全球领先的NAS设备厂商,Network Appliance公司从硬件、时间、容量和距离四个层面提供的综合存储容灾方案,确保数据的可靠性。 Network Appliance(简 称NetApp)公司的灾备方案包含四个层面的内容:硬件、时间、容量和距离。灾备的关键在于冗余。冗余是和成本相关联的,因此,我们需要考察数据灾难的概率、数据灾难带来的经济损失、以及实现灾备方案的成本等因素,综合全面地提出存储容灾方案来保证数据的可靠性。
硬件系统
首先NetApp优化系统的设计,降低系统复杂度,从而大大减少故障发生的概率;同时对关键的部件进行冗余设计,保证关键部件在发生故障时不会影响系统的正常运行。尤其对于保存数据的介质——硬盘——可能发生的故障,一方面,NetApp通过构建RAID来进行数据保护;另一方面,开发了具备独立自主产权的操作系统和文件系统,连同独到的系统硬件设计,共同提供充分的数据保护。
在系统设计时,NetApp采用Appliance结构的设计理念。正如Cisco公司设计路由器一样,NetApp的存储产品除了硬件自己独立开发外,还开发了具有独立知识产权的操作系统(Data Ontap)和文件系统(WAFL)。Appliance结构的设备是专品专用的,其设计目的是为了提供高性能、多功能、零管理、免维护的设备,以满足客户的需求。其开放性则由对标准协议的支持来充分保障。
在防范设备故障时,磁盘是最容易出现故障的因素。成熟的RAID技术用于解决磁盘的故障问题。NetApp的存储产品使用的是自己的RAID技术。这种RAID技术在充分保证系统的高性能以外,还给系统的扩展和重组带来巨大的灵活性。当某台设备出现故障时,用户甚至可以把文件系统对应的磁盘转移到另一台设备上,用户的数据依然可用;而当用户需要增加容量时,则无需关心过多的细节,只需通知系统需要增加容量,系统会自动完成扩容任务。采取何种RAID技术一直是系统管理员津津乐道的话题。许多系统管理员以为,只有采用镜像的方式才是最可靠的方案。其实不然,即使采用一个52块数据盘、一个校验盘的RAID,在损坏一块盘后进行数据重构时再次发生故障,其平均发生数据丢失的时间(Mean Time To Data Loss)也有11,935年;而当采用四个RAID组时,MTTDL的数值高达126,167年。在这样极小概率的事件下,其实没有理由必须采用镜像RAID来进行数据保护,毕竟这同样存在同层的两块盘同时毁坏的可能,并且是利用率最低、投资最高的一种RAID,而且在面对病毒攻击、恶意毁坏下,镜像的RAID完全无能为力。
恢复时间
通常我们考虑灾备方案时,总是使用磁带来做备份和恢复的介质。这种技术无法解决因此带来的需要长时间备份和恢复的问题。每天我们需要花费数小时来备份,而一旦需要恢复时,又得花上更多的时间。比如当我们需要使用每小时恢复100GB的带机恢复数据库时,300GB的数据库我们需要花上至少3小时。NetApp提出的革新的快照(SnapShot)和快照恢复(SnapRestore)能够免除上述的困境。利用快照,系统可以每隔几分钟或几小时进行一次全部数据的快照(快速备份),快照所需的时间仅仅是短短的几秒钟。这样的快照不仅仅系统管理员可以使用,普通用户也可以为此而受益。例如用户误删除了文件,就可以自行在一个特殊的目录下找回几分钟或几小时前的备份。这种技术花费少量的磁盘空间,带来的却是秒钟级的备份和恢复的好处。利用快照,系统获得了24小时的系统可用时间和24小时的备份时间,而传统上我们要么是系统可用时间加上备份时间为24小时,要么是我们在备份的时候牺牲系统的性能。利用快照恢复,管理员首先想到的不再是磁带,而是从快照中进行恢复,几秒钟时间我们就可以完成原来数分钟、数小时的工作;并且不仅是系统管理员,普通的用户也同样可以享受到快照的好处,如即使在系统管理员缺席的情况下,他们也可以自己恢复误删除的文件。
NetApp的存储产品还具备2分钟重起的功能。不仅大大减少了管理维护的宕机影响时间,同时还保证即便在灾难掉电的情况下,系统亦可以迅速恢复文件服务。
备份容量

图1 千兆以太网备份
除了在时间上革新了系统备份和恢复的概念外,NetApp在容量和距离上同样考虑周全。

图2 光通道的备份
当用户的数据需要保留相对比较长的时间时,最经济的方法是采用磁带。NetApp的存储产品可以直接和磁带机、磁带库进行连接。在磁带备份的方案里,NetApp除了支持原有的备份主机连接磁带库的方式外,还支持磁带库直接挂接在以太网交换机的方案(见图1),更和Veritas、Vixel、ATL等六家厂家一起提供备份存储局域网方案。此方案被业界称为“Lan-Free”的解决方案(见图2)。而且利用NetApp和Legato倡导的NDMP协议,可以大大减少备份时对网络和备份主机的资源消耗。
高可用性和容灾
针对电信、银行等往往要求系统提供7×24的高可用性的用户,还提供Active-Active的双机容错模型,平时提供负载均衡,发生故障时则能起到接管故障机,保障数据访问服务不被中断。NetApp更提供利用SnapMirror构建的远程容灾方案来应对可能发生的自然灾难(火灾、水灾、战争等)或系统永久性毁坏。
NetApp的存储可以和多家第三方厂家的Cluster软件进行集成,如Veritas VCS、HP MC/Service Guard、IBM HACMP、Microsoft MSCS和Legato的Cluster软件等。这些解决方案都是经过各厂家认证的。(图3)是采用NetApp的存储构建的高可用性容灾解决方案。方案里采用双机容错式(Cluster)的存储组成高可靠、高可用的数据存储平台,每个机头通过网络捆绑技术(Trunking或EtherChannel)把两块网卡设置为主备用(Active-Standby)方式,拥有同一个IP地址,并交叉连接到两台网络交换机上;前端的主机采用相应的集群软件,设置成集群容错模型,并分别连接到两台交换机上。当存储发生硬盘故障,系统有RAID进行保护;当存储系统的机头发生故障,另一个机头会接管故障机头的所有设备,保证数据能够继续服务;当网络链路发生中断,交换机会负责寻找迂回路由;当前端主机发生故障,则由另一台主机接管故障主机的业务。这种高可用性的解决方案能够充分保证主机、网络、存储三个层面上的高可用性。

图3 高可用性容灾
该高可用性方案的一个扩展,就是加入远程容灾的内容。用户可以利用NetApp的存储设备里的SnapMirror功能构建起远程容灾的方案,以防备本地数据的彻底毁坏。数据中心的数据可以定时地复制到异地的容灾中心,数据中心和容灾中心之间可以采用公网或专线来进行连接。当本地的设备丧失服务能力时,设在异地的容灾中心可以迅速地从备份状态变更为服务状态。继续向用户提供数据服务。NetApp的远程容灾方案具备智能断点续传、层次构架、临时有效等优秀的功能。
所以,利用NetApp的这一系列优秀的功能,可以大大地减少计划外或计划内的宕机时间,充分提高数据的可用性。NetApp的灾备方案综合解决了在设备、时间、容量和距离四个层面上出现的数据灾难情况,并可以拓宽备份窗口,同时可以提高系统的服务时间,达到7×24小时的服务。



本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/68571/showart_681741.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP