免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 855 | 回复: 0
打印 上一主题 下一主题

[归档与迁移] 海量文件如何保存 全面解读归档应用 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-07-30 15:34 |只看该作者 |倒序浏览

当公司面临着重要数据每年不断增长的状况时,存储管理的技术瓶颈却没有得到改善。一方面企业要确保遵循规范的业务记录以及法律诉讼信息的保存,还需要考虑保存的这些信息的安全性,使得越来越多的数据被强制保存。结果是,一种全新的归档技术出现了。
    归档(Archiving)——由一系列策略、流程和技术所组成,慢慢的已经成为那些遵守法律、规范以及拥有复杂信息技术的公司所必需的业务。作为第一步,公司必须区分并且归类信息集,然后基于数据内容、商务规则以及信息技术标准对这些信息集实施策略。一旦这一步做完了,已经实施的策略就会自动执行,从而减少管理存储环境的成本并减少公司所面临的风险。
归档的挑战
    当今,公司在归档方面面临的挑战如下:
    确保遵守规范。一些规范,例如SEC 17a-4、NAND 3110、HIPAA、CFR Part 11以及SOX,要求很多不同产业的公司都需要它们的特殊商业记录得到正确的捕获并且通过一种安全的方式得到保持,该种安全方式可以确保记录的完整性、可靠性以及可访问性,并且有一些方式则有求存储中使用的介质不能被重写。一些规范则保证了信息的保持力,包括对特殊时期的索引以及信息存储。满足遵守规范需求的核心就在于对于审核所需要的信息记录可以有及时并快速的提供能力,一般是在24到48小时之内。
    减少电子检索(edisconvery)的风险。最近美国联邦法案的修订对电子检索规定了更多的步骤和控制,而且,各个洲法庭以及联邦法庭的规范对于信息破坏以及篡改做了更严厉的惩罚规定。在当今诉讼请求不断增加的商务环境下,公司必须在法律下遵守职责以保护用于某种目的的电子信息。在有电子检索的请求时,采用传统的基于序列的归档技术——比如磁带,来找到电子邮件以及其它文档时间上的代价是非常昂贵的,并且往往缺乏效率。因此针对电子发现的对于授权的索引信息的检索在当今的环境中是绝对必须的。
    有效管理完全不同的知识库、归档以及相关技术。当今,公司正在寻找对不同应用——包括商业以及公司发展的应用的内容进行归档的办法,以形成一个单一的归档架构。但是对于目前的公司来讲,已经拥有不同的内容资源、资源本身是不同的物理归档并且采用不同的归档技术是非常普遍的现象。对这些资源的管理、培训以及不同系统的技术所需要的资金是巨大的,并且这种完全不同的架构会限制相应的信息管理服务,比如集中的搜索/获取、数据安全、审核以及数据完整性。 企安网http://www.uubc.cn
    减少管理和资金成本。信息技术公司在进行对归档架构投资保护时寻求相应操作效率的提高。管理完全不同归档所导致的结果和寻求提高信息管理操作效率并在公司内部共享知识的目标是完全不一致的。信息技术公司需要保护他们在技术、应用以及信息技术策略上的投资。如果所采用的技术完全铺开,并且公司在技术层次上仍然不能和其它组件相结合,则会限制公司投资最大化的能力。因此,软件、系统以及存储,无论是旧的还是新的技术,都应该一起工作以形成一个集成的、整体的管理办法,进而让公司进行优化,保证对原有技术投资的扩展保护,懂得这一点是非常重要的。
    确保灾难恢复的能力。灾难恢复方法和技术对于业务以及法律上非常有价值的数据是十分关键的。专注于保证公司信息得到保护的规范,灾难恢复计划以及方法对于主要的和归档数据都非常重要。当发生物理上灾难时,归档数据要能够得到恢复,并且那些静态的数据也可以被访问得到。因此,当前很多公司已经开始依赖于远程复制功能来作为灾难恢复的方案,当然还有一些公司使用低成本的可移动介质方案来实施离线存储。 企安论坛 信息安全技术交流http://bbs.uubc.cn
需要考虑的因素和步骤 企安论坛 信息安全技术交流http://bbs.uubc.cn
    归档的最佳办法需要考虑商务以及公司的技术需求。最佳的办法既包括公司如何管理关键的信息集商务规则,同时也要满足成本、性能、可用性以及已经建立的安全需求。
1.信息记录的评估
    美国国内法律规定发生变化所导致的结果是必须准备并且懂得哪些信息储藏是存在的。一旦信息集的详细记录已经进行了,公司就必须针对这些信息集建立相应的策略。策略应该将访问/索取需求、记录保持以及部署需求和保护公司、员工、合作者的敏感信息合并在一起。

    2.策略开发和文档
    归档是一个水平的、交叉功能的过程,它通过技术来例化商务规则。归档中最重要的第一步就是开发策略和文档。当使用技术实现了上述策略时,就应该有一些方法来验证并且证明这些策略是有效的。 企安网http://www.uubc.cn
    3.建立全面的策略
    策略实际上就是商务规则,这些规则应该将账户规范(保持力,完整性,可用性)、法律(保存)以及商务部署考虑在内,并且在系统内重新使用这些需求。公司不仅仅再考虑外部需求,而且也在不断将内部信息技术管理考虑在内,因为公司自身想管理其很重要的信息集,比如财务、员工以及客户数据、公司的知识产权等等。
    4.采用一个基于团队的方法
    归档需要考虑核心技术以及商务相关人的不同需求。公司需要建立一个以技术为基础的信息管理的方法,这其中包括归档。归档团队的主要商务相关者机构一般需要包括次财务、风险管理、法律、规范、安全、记录管理、信息技术以及商务经理。 企安社区http://blog.uubc.cn
归档方案的技术实现 企安论坛 信息安全技术交流http://bbs.uubc.cn
    1.将参考数据从主要的存储系统中移走并且还要能够提供相应的访问
    IDC使用一种基于应用的数据分类方法:参考数据和交易数据。交易数据是在商务交易中创建和管理的,并且它和特殊的商务过程相关。而参考数据则一般情况下是固定的、静态的数据,它描述了商务的事实并且在商务过程中被用来参照,没有特殊的过程结束点。
    非交易的参考数据数量在整个存储中占有一个很大的比例,依赖于所安装的内部系统、商务过程以及公司操作的垂直产业,一般要超过50%。因此,将参考数据转移到低成本的介质上,同时还可以提供访问性,这样就提高了整个系统的性能并且降低了存储的成本,并且压缩了整个的备份窗口。
    2.保持对参考数据的冗余拷贝
    通常情况下,公司在不同地点保存两份参考数据的拷贝以进行灾难恢复,并且减少数据的危险性。对一些经常作调整的公司,用于灾难恢复的数据拷贝被放到拱顶或者仓库,这些地方是防火的,并且会限制对介质物理上的接触。因此,公司经常依赖于一些可移动的介质。 企安论坛http://bbs.uubc.cn
    3.对归档内容提供快速的、随机访问
    公司在不断使用快速的、随机访问的介质来存储归档内容,使它们成流线型以及优化存储位置的相关内容以进行规范审核、检索请求或者商务需求。IDC发现对于数字内容的响应时间在不断减少。规范审核、法律检索以及商务需求都需要信息可以被快速并准确地获取——通常几个小时,而不是几天的时间。
    4.确保数据不被篡改并且记录真实
    有一些很严格的规范需要数据以一种不能被重写的方式存储。有一些敏感的以及安全级别高的环境需要通过硬件来实现对数据的保护。公司需要归档的数据不会随着时间而改变,并且不会在保持期进行修改和删除,并且为了法律和规范的目的,依赖于技术来检查数据的真实性。 企安论坛http://bbs.uubc.cn
    5.归档寿命应该和数据周期相符
    许多公司当前都面临着数据保持周期的问题,有一些资料,比如财务记录以及客户合同,是需要永久归档的。其它公司则保持相应的财务记录需要50到100年。这些保持数据的周期——从50年到永久,是需要介质本身的寿命以及存储数据的应用程序而定的。
6.用于结构可扩展的设计
    依赖于数据的增长率以及保持力、保存责任以及公司法律的需求,现在的归档一般会从50到100TB不等,并且归档会以5年为一个周期显著增长。公司当前对归档的设计要能扩展到今后的5-10年,这样整个的结构就可以以一种非破坏性的、在线的方式转移到下一代技术上。
    7.确保恢复的多拷贝
    许多公司都希望在一个地点做多个归档拷贝,一个用于访问的本地拷贝,另一个用于灾难恢复的安全备份方法。随着归档内容对于公司的环境越来越重要,公司也必须有一份放置于远距离的拷贝来防止一个地域的灾难。 企安论坛 信息安全技术交流http://bbs.uubc.cn
    8.使用标准的接口
    大多数公司都有过使用自己API集成或者缺乏对内部开发应用程序的支持的痛苦经历。目前,最好的方法是使用一些公开的标准,比如CIFS、NFS、WBEM以及开发标准,比如XAM。这些标准的支持可以让应用程序的集成性更简单并且更容易维护。 企安论坛http://bbs.uubc.cn
仍然存在的挑战
    一些趋势是推动归档实现的主要因素,比如非结构数据类型的持续膨胀、NAS的进一步巩固、分层存储、从物理和磁带归档到数字归档的转移。在今后的5年里,IDC预测归档将不仅仅局限于规范以及法律的需求,并且主动的、在线的数据归档将不断用于知识管理。
    通过各种形式和目的的数据挖掘,归档会变得更具竞争力。用于归档的内容源会从email扩展到文件系统、应用程序、数据库并且最终是整个桌面。但是,随着归档技术的不断成长,公司仍然面临着很多的挑战。 企安论坛http://bbs.uubc.cn
    对归档和备份混淆
    IDC发现很多公司仍然对归档和数据备份含混不清。备份服务器是在发生系统和数据的损坏时,用于提供系统的重建或者恢复功能。备份典型的需要周期性的进行,并且介质是循环使用的,旧的备份就会被破坏掉。因此,归档的典型功能就是对特殊记录进行永久的保存,根据规范遵守、检索以及一般的商业需求。用于归档和信息检索的硬件和软件是和传统的备份完全不同的,为了保持、保存以及部署数据提供了相应的策略。不能确保性能或者访问的归档技术使得归档的备份变得很有必要,对于参考数据的归档牺牲了减少成本的优势。 企安论坛http://bbs.uubc.cn
    数据检索与发现
    许多公司都有需要永久保存重要的商业和财务记录。但是如果需要对100年后的数据进行检索,当前用于创建数据的应用程序则不能进行很好的支持。而且用于存放100年后数据的介质不能够和当前的应用进行很好的互操作。整个归档产业仍然处于标准制定的阶段,并且这些标准必须要确保100年前创建的数据和当前技术能够互操作。
    归档的最佳办法起始于信息管理策略的开发以及文档。当前在归档技术上处于领先地位的公司则认为:归档是方法、策略以及技术的结合体,权衡了经济规模、降低风险以及提高效率三个因素


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/66684/showart_1097019.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP