免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1512 | 回复: 0
打印 上一主题 下一主题

磁盘vs磁带:一场虚构的战争 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-11-14 11:07 |只看该作者 |倒序浏览
  在如今的民用消费领域内,磁带介质的身影似乎从人们的视野中消失,取而代之的是那些早已被广泛应用的 CD、DVD等光存储产品,以及基于磁盘的数据存储系统。这就很自然地让人们进一步联想到,作为在存储行业中叱咤风云几十年的磁带系统,是否也将不得不面对同样的命运呢?事实上,这个问题很难得到准确的回答,因为几乎没有人能够完全肯定地给出答案——Yes, or No。即使是那些相信磁带的末日已经近在眼前的铁杆磁盘系统厂商,也无法给出一个确切的时间表来预测磁带将在何时完全退出历史的舞台。但是,从目前的现实情况来看的话,磁盘阵营正在加快推出各种“新式武器”,对磁带市场发起了一轮猛似一轮的“正面强攻”。很多原先一直由磁带系统所“统治”的应用领域,如今正在一点点地被新兴的磁盘系统所吞噬着。并且有大量数据表明,这种变革正在不断地加快着它的步伐。

  面对磁盘如此地攻城掠地,肆意扩张,拥有近50年历史的磁带自然不会坐以待毙。不过,如果直接与磁盘对拼性能的话,显然不是很明智的做法。然而,若是能够充分发挥自身的特长,采用“迂回战术”,转移战场的话,磁带的前景也肯定会避免沦落到黯淡无光的境地,就此柳暗花明又一村了。当然,这些只是战略上的问题,真正具体到战术上的话,磁盘、磁带则各有各的妙招。一攻一守,一进一退。显然,从表面上看去这是一场对立技术间的战争!至少现在你可以这么认为。

  下面我们就首先来看看如今带给广大厂商和用户很多美好愿景的新兴磁盘技术是否真的能像其产品宣传册上所说的那样,已经能够彻底地“革磁带的命”了呢。

  磁盘阵营,日益强大

  托SATA磁盘的福,如今的各种新型磁盘系统和概念真是让人有点眼花缭乱了!并且各自所标榜的性能和特性也确实让人热血沸腾。虽然大多价格不菲,但总是让人认为物有所值。不过经验告诉我们,在大多数情况下(尤其在IT领域中),“新”的另一层含义就是“不成熟”。因此所有这些(其中最短的可能只推出了几个月)新技术或产品是否真的已经“修炼”到了能够彻底替代早已成熟的磁带的地步呢?

  Enterprise Strategy Group的创始人兼资深分析师Steve Duplessie表示:“那些大公司将不断地将他们那些曾经保存在磁带库中的,数百TB的数据转移到新兴的磁盘系统上去。例如,我曾经接触过一个大型石油公司。他们就认为,如果将他们高达2.6PB容量的数据保存在由Engenio提供的磁盘系统上的话,与从磁带上完全恢复这些数据的成本相比,在磁盘系统上恢复的成本要相对低廉。”

  看来用户和业内人士对于磁盘系统的反应还不错。不过,我们的用户所面对的并不只是“是否需要将磁带系统更换为磁盘系统”这样一个单纯的选择性问题。除此以外,用户还要在众多的,针对不同存储应用(备份,归档或业务连续性等)而产生的不同种类的新兴磁盘存储系统中做出选择。这些新兴磁盘存储系统主要包括虚拟磁带库(Virtual Tape Library,VTL)、近线磁盘系统(Nearline disk system)、大规模非活动磁盘阵列(Massive Arrays of Inactive Disks或Massive Array of Idle Disks,MAID)、内容寻址存储(CAS)以及持续数据保护(Continuous Data Protection,CDP)技术等。

  虚拟磁带库(VTL)

  什么是VTL?简单地说,VTL技术就是一种能够让整个系统将磁盘存储设备识别为磁带设备的技术。它可以分别通过纯软件或软硬件相结合的方式来实现。我一直认为VTL是一种很“狡猾”的技术。它就如同打入敌人内部的奸细,表面上(对于前端系统来讲)非常磁带,但内心却十足地磁盘。很是高明!

  使用VTL技术的优点是显而易见的,它可以直接与企业现有的磁带备份软件以及底层连接设备相兼容。这就意味着VTL技术能够很好地保护近十年来的投资,不用彻底更换或马上升级那些老设备,而同时又能够获得高于磁带的备份/恢复速度。

  但同样的,任何技术都有它的弊端,一旦已有的VTL上的磁盘容量被占满,还是要将数据再次转移到磁带介质上的(从某种意义上讲,由于可以不断地增加介质数量,因此磁带系统的容量是无限的)。而这就有可能重新引发新的问题。

  针对现有的VTL技术,GlassHouse Technologies公司的W. Curtis Preston表达了他的看法:“即使我们假设VTL拥有足够使用的磁盘空间,企业最终还是会发现他们依然需要为那些已经不再使用的机器人磁带许可(robotic tape licenses)付费。厂商们总是力图让你相信部署VTL系统是多么轻而易举的事情。但事实上,如果真的想要达到理想的效果,就必须重新设计我们的这个系统。”

  如今的VTL,正在开始尝试与其它的一些先进的存储技术相结合,以求弥补它在应用中的缺失。例如,飞康(FalconStor)公司就已经将持续数据保护(CDP)技术集成到了它的VTL产品中。飞康公司的销售副主管Wendy Petty就认为,通过这种组合,今后的用户将完全可以在得到VTL技术所具有传统优势的同时,也拥有来自CDP技术的优势特性,即快速恢复。

  目前,已经有越来越多的厂商开始进入这一领域,其中包括:Sepaton、飞康、昆腾、ADIC、Diligent和Overland等。

  近线磁盘系统

  对于近线磁盘系统这种设备,我们完全可以把其看作是一种基于磁盘的,用于大型数据传输的“缓存”设备。也就是说,在数据被保存到磁带设备以前,将首先被传输到速度更快的磁盘系统中来,以消除整个系统由于磁带写入时速度过慢而造成的传输瓶颈。一般的近线磁盘系统都会使用相对成本较低的SATA磁盘来作为其存储的介质。

  近线存储系统的优势就在于它很好地解决了高性能与低成本之间的矛盾,能够以相对廉价的成本换取相应合理的性能提升。但同时,其所使用的SATA磁盘也引发了一场有关数据可靠性的争论。很多反对者就认为,由于ATA技术并非是针对企业级的高端应用而设计的技术,因此改为串行连接的SATA磁盘依然不能够替代高端的SCSI磁盘而出现在企业级的存储设备中。但这种看法,显然曲解了SATA的原始定位。正如我们前面所提到的:“以相对廉价的成本换取了相应合理的性能提升”,SATA的所有特性(相对低廉的价格,很大的容量,更快的速度)其实都是针对于磁带介质而言的。事实上,也正是由于SATA的出现,才打乱了磁带与磁盘之间原本各司其职,相安无事的局面。并且在技术的互补方面,还可以通过使用不同等级的RAID来对SATA的缺陷进行弥补

  然而,把廉价的磁盘系统仅仅作为整个系统中的“缓存”来使用,这并不能达到所有用户的要求,他们还有更高的期望,即一套整合了各种技术优势的完整的备份解决方案。目前,已经有越来越多的厂商推出了基于磁盘系统的完整的备份解决方案来满足市场的需要。“更长的保存期限以及更低的故障率,这些都是磁带介质所不具备的优势。最主要的还是D2D设备的速度优势,这让它成为了那些急于进一步缩短备份窗口的用户最终的选择。”Unitrends公司的产品主管Mark Phillippi这样说道。

  大规模非活动磁盘阵列(MAID)

  MAID技术最直接的作用就是为大型阵列的磁盘提供了“随需启动”的功能。MAID中的每一块磁盘只有在系统需要对其进行数据存取的时候才会启动,而平时的大部分时间,磁盘都会处于断电状态。这点和磁带库中磁带介质的工作状态很相似。这样做最大的好处就是大大节省了磁盘系统的耗电量,进一步降低了磁盘系统的使用成本。

  我们以COPAN系统公司的Revolution 200T为例,它最多能够装载896块磁盘驱动器(每块的容量为250GB),最大容量为224TB。使用此技术,用户能够同时访问这个磁盘库中25%的数据;而如果是改为使用磁带库的话,这个数字仅为1% 。同时,MAID还同时拥有很多VTL的特性。在COPAN的设备前端,就拥有一个VTL平台。

  COPAN公司的首席工程师Chris Santilli表示,即使在所有的磁盘都处于断电的非使用状态下,此系统依然会不间断地对这些磁盘进行监控,以确保所有的数据都随时可用。一旦发生数据错误,RAID将会及时发现并进行修复。而对于磁带介质来讲,我们无法对处于闲置状态的磁带进行数据监控,同时也不可能连续几年都使用同一批磁带的,因为如果这样,就会很容易造成数据恢复时的失败。而对于那些需要保存归档数据(一次写入后,偶尔访问),却又无法忍受过慢的磁带速度的用户来讲,MAID无疑是他们最好的选择。

  不过令人感到遗憾的是,一套MAID的起始售价就在12万美元左右,因此目前MAID的目标客户群仅为那些大型企业。

  内容寻址存储(CAS)

  CAS为我们提供了一种快速访问某些特定数据的方式,它区别于传统文件系统的最主要特征就是使用了所谓的内容寻址(Content Addressing)技术—— 即通过使用那些由内容源数据所生成的数字标签来进行数据寻址。目前,在CAS领域最有实力的厂商应数EMC,同时它也是这项技术的最早发起者(2002年 4月推出Centera)。随后,其他的众多厂商也纷纷加入到这个领域中,其中包括IBM、HP、Kasten Chase、StorageTek、Archivas、Permabit、Avamar等。

  说到CAS的最主要优势,以下几方面不能不提:
  1. 能够确保所保存内容的高可靠性;
  2. 为寻址提供了与数据内容相关联的惟一标识符;
  3. 只保存多个相同数据的单一副本和映像。

  但是,由于新技术的标准化高度未能达成,会在实际应用上给用户造成困扰。因为到目前为止,在CAS的实现技术上还没有两家厂商可以达到完全一致。由此就造成了市场上来自不同厂商的CAS产品均不能相互兼容的状况。

  目前,CAS的重点应用领域主要集中在医疗影像、电子邮件归档、企业级文件管理

  或那些需要对大量固定内容进行快速访问的领域。但它并不会代替传统的数据库环境。

  容量优化存储(COS)

  以Data Domain为代表的一些厂商目前正在大力鼓吹一项不同于CAS的新技术——容量最优化存储COS(Capacity Optimized Storage)。据来自Data Domain公司的行销主管Bart Bartlett表示,由于使用了全新的压缩及过滤技术,因此他们新推出的Data Domain DD400系列磁盘备份系统能够自动减少20%的备份次数。

  “这是一种应对如今数据急速增长的好方法。它的基本原理很简单,就是对于已经备份过的数据,系统将不再对其进行备份,而只是为其添加一个指向原始数据副本的指示器。Data Domain DD400将对待备份数据进行低于块级(sub-block level)的检查,然后再进行数据压缩,最终进行增量备份。通常进行增量备份的数据量仅为压缩前的1/6(这并不包括初次进行的全备份),” Bartlett表示。

  由此我们可以看到,目前各种基于磁盘的存储技术正在不断地涌现出来,并且无一不把矛头指向了有着“悠久”历史的磁带产品,想要取而代之。磁盘阵营中果然英雄辈出、人才济济呀。看来磁带的麻烦还真是不小呀!但到底谁能成为磁带的终结者,又或者是否存在磁带的终结者,我们到此依然不可妄下定论。但可以肯定的是,任何技术在其发展中的任何一个阶段,都会同时具备优势和弊端两个方面。我们不可以盲目地认为所有的新兴技术在各种应用领域都肯定会优于那些成熟的老技术。下面我们就通过对D2D/D2D2T的分析,来看看那些新兴的磁盘技术到底能给我们带来什么样的惊喜与期待,又有哪些不尽如人意的地方需要弥补。

  D2D/D2D2T——最近比较红

  毋庸质疑,如今的D2D(Disk-to-Disk)技术确实为解决传统的备份/恢复工作提供了更好的方法。它不仅可以有效地缩短备份时间,提高存储管理员的工作效率,而且还能在很大程度上减少由于备份工作失败所带来的风险。

  在以下的讨论中,我们将把D2D(Disk-to-Disk)和D2D2T(Disk-to- Disk-to-Tape)这两种技术放在一起作为一种设备来讨论。虽然它们之间依然存在着一些技术上的细微差异,但是实现的原理和应用的领域基本上是一致的。首先,在此技术中有一点是很明确的,那就是D2D设备并没有专门的机械装置来负责将数据从D2D设备上转移到磁带介质上面去。这也就意味着,如果你选用了D2D设备,并且还有要将某些数据转移到磁带介质上的需要,那么你就必须使用额外的备份服务器和磁带设备来完成这项将数据向磁带转移的工作(这个过程并不牵扯到你的D2D设备)。当然还有另外一种情况,那就是你的备份软件能够将你的D2D设备作为磁带设备的目标数据源

  而在这一方面,与D2D设备相对应的是,D2D2T设备的后端通常可以与SAN或直接与磁带驱动器/磁带库相连(此连接通常情况下是通过FC来实现的)。在备份软件或D2D2T设备自有的相应功能控制下,数据自动地完成从D2D2T设备中向外部转移的工作。因此,在本段论述中,如果不专门涉及到是D2D2T设备的话,我们都将统一使用D2D来表示此技术。

  虽然,在如今的数据备份/恢复领域中,D2D技术拥有很多显而易见的优势。但是事实上它并非可以解决所有的备份问题。IT经理们经常能够听到存储厂商在他们面前夸耀自己的D2D产品如何具有吸引力。例如,它们是具有如此低的成本;却又拥有如此快的恢复数据的速度;简直可以轻而易举地马上取代现有的磁带产品等等。但是在这些充满诱惑力的优势背后,有一点是应该引起我们注意的:那就是无论我们面对着一个拥有多少优点的产品或技术,我们首先最应该做的就是保持一个清醒的态度,没有任何新技术是十全十美的,忘掉厂商的形容词,淡化那些诱人的数字,认真面对你的需要,仔细权衡要得到它你所要需要付出的代价和它所能为你带来的收益。

  D2D真有那么好吗?

  最近,Diogenes Analytical Laboratory的专家们对来自7个厂商的8种不同的D2D设备和D2D2T设备进行了测试。对于测试结果,这些不同的产品和技术在各个方面所表现出来的巨大差异,让我们觉得十分惊讶,但同时也感到十分欣慰。因为正是由于这些产品和技术之间存在的种种巨大的差异,才为我们的用户带来了更大的选择空间,让我们可以随需应变。而如果某种产品或技术的市场选择空间变得越来越狭小,那么可以预见这个市场也将会变得越来越混乱,越来越多诉讼与反诉讼将会充斥其间。

  不管在任何时候,如果有一个厂商对外宣称他们可以为客户提供更低的TCO(总体拥有成本)的时候,一定马上会有人质疑说“你所谓的更低是在何种条件下与谁相比较而得出的呢?”当然,在大多数情况下“什么都不做”是获得最低成本的最有效途径。当你 “什么都不做”时,就不会产生任何购买成本、培训成本以及专业性劳务成本。但显然,“什么都不做”的后果就是会为我们带来更大的风险和更高的运营成本。同时,“什么都不做”往往只是在没有相应预算或根本没有资金的情况下所做出的迫不得已的选择。在更多的情况下,所谓更低的TCO通过是指与同时期市场上相类似的产品,相近的技术或行业中竞争力最弱的对手所比较而得出的,因为最弱的对手必然会因其在技术和服务等方面的缺失而大大提高其总体成本。

  具体到D2D的实际情况中,它所谓的可以提供更低的TCO并非意味着可以带来绝对的金钱上的节省。事实上,我们认为D2D对于如今的存储市场来讲应该是一种“AND”的技术,而并非是一种“OR”的技术。尽管由于D2D的出现,解除了以往管理员必须每天定时到现场更换磁带的麻烦,但是D2D并非是一种可以完全取代现有磁带产品的技术。现在,大多数媒体级和企业级的数据中心经常会花费数十万美金来购置D2D系统。当然,D2D2T设备(例如虚拟磁带库)确实能够极大地提高磁带的实际利用率(Tape-packing rates),而这种改善所带来的结果也确实能够在很大程度上减少那些需要我们进行管理的磁带的数量,但这并不会降低实施D2D2T系统的总体成本。值得注意的是,在我们满怀期待地将这套价值不菲的新系统请进我们的数据中心,并连接到已有SAN上的时候,我们还必须要为它提供更多的FC端口、更多的线缆等设备。没错!D2D技术确实是每一个数据中心都应该去认真考虑的新技术。但是用户还是不要对实施了D2D技术后就能够大幅降低你的IT预算抱有太大的幻想。

  D2D的备份速度

  关于D2D设备的备份速度,有很多准确可信的测试数据,它们往往都显示了如今的D2D设备的备份速度是普通磁带系统的10倍。但是,如果在现实中只注意到这些看上去十分令人满意的数字,我们的IT经理们往往就会被其误导,认为这个速度就是我们将会在D2D设备中得到的真实体验。当然,如果以一套高端的D2D系统与那些被胡乱设置或根本就不具有可比性的低端磁带系统进行对比的话,其结果确实可以达到让人惊讶并满怀期待的效果。但是,我还是要建议我们的IT经理们要保持冷静,要看到更深层次的性能问题。

  在对这些各种各样的D2D产品的测试中,Diogenes Analytical Laboratory并没有选择产品所标注的基本性能指标作为评估的一部分。原因是他们认为那些标注的基本指标往往并不能反映在实际操作中产品所表现的真实状况。在大多数情况下,我们要对某些系统的传输速度进行测试。例如在某次测试中,他们发现数据的真实传输率仅为35MB/s。这听起来确实让人非常沮丧,要知道这个速度仅与一个单独的LTO-2磁带驱动器的传输速率相当。

  这个数字让我们更深刻地意识到对整个相关的存储系统的调试工作对于D2D系统性能的重要性,而此项工作的重要程度甚至高于对磁带系统进行调试的重要性。系统管理员们依然需要对整个备份环节中所涉及的每一个方面进行优化。这些方面包括:

  * 备份/介质服务器 如果在备份过程中,服务器的处理器使用率已经达到或超过了80%,那么就应该及时升级服务器的处理器和内存。
  * 网络带宽 网络连接(不论是LAN还是SAN)的速率必须能够满足数据传输的需要。
  * 目标设备的速率 目标设备(不论是磁盘还是磁带)必须能够应付与之相连的设备的传输速度,以便及时读写数据。
  * 数据源设备的输出速度 作为数据源的阵列与备份服务器之间的传输速率,应该要高于D2D系统中其他部分的传输速率。

  这四方面往往是影响备份性能问题的最普通的因素。如果其中的一方面没有被解决好的话,那这一方面就会像水桶上最短的那片木板,成为整个系统的瓶颈。在我们的测试中,问题往往被发现是出现在备份服务器身上,而并非那些D2D设备。

  D2D/D2D2T的优势

  在测试中,Diogenes Analytical Laboratory还发现,只要系统整体的传输速率高于磁带性能,我们就能够体验到D2D技术所带来的多项优势。例如,单独的文件恢复工作总是可以在瞬间完成。因为这个过程不需要涉及到找磁带,读取磁带或扫描磁带这些步骤。但是在完成需要移动大量的数据卷的工作的时候(例如恢复整个的数据库或系统),系统整体的传输速率就成了一个决定性的问题。此外,D2D系统还省去了以往磁带产品所带来的“擦皮鞋”(指磁带不断地启/停)或“回倒”等一系列麻烦。

  D2D(磁盘到磁盘)

  D2D技术通常是通过使用相应的设备来实现的。而这些设备中所使用的阵列往往是由廉价的ATA 或Serial ATA(SATA)磁盘驱动器所组成的。在大多数情况下,D2D设备是与磁带设备不同的。D2D设备拥有专门的软件来管理整个系统和数据的传输。同时,这些D2D设备几乎都支持其他软件厂商的备份/恢复软件,来帮助系统从主要的存储资源处来获得数据。而且在某些情况下,D2D设备也可以通过使用复制软件来在不同的设备之间进行数据转移(包括本地和远程复制)。

  在大多数情况下,D2D设备对于标准的备份/恢复任务来讲,是目标存储设备。因此它们往往被人们看作是很“温顺”的设备。在现实的大多数(并非全部)情况中的确如此。并且,使用D2D设备规划备份/恢复工作并不比直接到磁带更困难。然而,如果存储管理员想要进行离线式的磁带保存,那么就必须规划一个D2D设备向磁带设备转移数据的子任务了。但是不管在什么情况下,所有由于备份/恢复应用而复制的数据都将在备份/恢复的目录中被记录和管理,这就大大简化了以往的管理工作。事实上,对于D2D设备来讲,每天需要我们做的就只是进行一次最初的 “Setup”和配置就可以了。

  而对于D2D备份方式来讲,一个主要的不利因素就是它需要进行第二次的数据转移(如果存储管理员想要对数据进行离线式的磁带保存的话)。一般来讲,用户可以有两种选择:第一,可以先让数据写入磁盘,然后再从磁盘写入磁带中。第二,这两个过程也可以同时进行。如果执行第二种选择,那么备份服务器将要同时处理这两个任务。另外,在数据流最大的时候,所需要的带宽将可能达到平时的两倍。如果是第一种磁盘和磁带进行顺序复制的情况的话,那么系统的处理时间也将会加倍。同时离线磁带的转移工作也会被延长一段时间。并且这还会增加数据丢失的风险。

  D2D2T(磁盘到磁盘到磁带)

  由于D2D2T设备自身拥有将数据转移到磁带介质上的能力,因此相对于单独使用D2D设备来讲,D2D2T设备在应用上为我们提供了更多的可能性。此外,几乎所有的D2D2T设备都能够以磁带格式来记录数据,并且模仿带库级的磁带设备。这就使得通过D2D2T设备向磁带设备转移数据的任务变得异常地轻松。而实际上,对于那些始终运转的备份恢复应用而言,这些D2D2T完全就是普通的磁带设备。

  在某种意义上讲,D2D2T的特性与前面我们所说的D2D的特性正好相反。它拥有专门的单元和程序来负责将数据从磁盘上转移到磁带上。并且整个过程并不会对备份服务器造成不必要的负担。在有些情况下,D2D2T设备中的数据并不一定要等到对主数据源的备份任务彻底完成以后,才能够开始向磁带设备转移。这样就大大的缩短了由于磁盘拷贝与磁带拷贝之间的不同步而产生的时间延误。当然,这整个过程依然不会对你的服务器和网络造成任何影响。此外,在整个数据的迁移过程中,D2D2T设备能够随时对处于任何阶段的数据进行管理。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP