免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1318 | 回复: 0
打印 上一主题 下一主题

[VTL与磁带系统] 磁盘vs磁带:一场虚构的战争 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-11-23 16:20 |只看该作者 |倒序浏览
   在如今的民用消费领域内,
磁带
介质的身影似乎从人们的视野中消失,取而代之的是那些早已被广泛应用的 CD、DVD等光存储产品,以及基于磁盘的数据存储系统。这就很自然地让人们进一步
联想
到,作为在存储行业中叱咤风云几十年的磁带系统,是否也将不得不面对同样的命运呢?事实上,这个问题很难得到准确的回答,因为几乎没有人能够完全肯定地给出答案——Yes, or No。即使是那些相信磁带的末日已经近在眼前的铁杆磁盘系统厂商,也无法给出一个确切的时间表来预测磁带将在何时完全退出历史的舞台。但是,从目前的现实情况来看的话,磁盘阵营正在加快推出各种“新式武器”,对磁带市场发起了一轮猛似一轮的“正面强攻”。很多原先一直由磁带系统所“统治”的应用领域,如今正在一点点地被新兴的磁盘系统所吞噬着。并且有大量数据表明,这种变革正在不断地加快着它的步伐。
  面对磁盘如此地攻城掠地,肆意扩张,拥有近50年历史的磁带自然不会坐以待毙。不过,如果直接与磁盘对拼性能的话,显然不是很明智的做法。然而,若是能够充分发挥自身的特长,采用“迂回战术”,转移战场的话,磁带的前景也肯定会避免沦落到黯淡无光的境地,就此柳暗花明又一村了。当然,这些只是战略上的问题,真正具体到战术上的话,磁盘、磁带则各有各的妙招。一攻一守,一进一退。显然,从表面上看去这是一场对立技术间的战争!至少现在你可以这么认为。
  下面我们就首先来看看如今带给广大厂商和用户很多美好愿景的新兴磁盘技术是否真的能像其产品宣传册上所说的那样,已经能够彻底地“革磁带的命”了呢。
  磁盘阵营,日益强大
  托SATA磁盘的福,如今的各种新型磁盘系统和概念真是让人有点眼花缭乱了!并且各自所标榜的性能和特性也确实让人热血沸腾。虽然大多价格不菲,但总是让人认为物有所值。不过经验告诉我们,在大多数情况下(尤其在IT领域中),“新”的另一层含义就是“不成熟”。因此所有这些(其中最短的可能只推出了几个月)新技术或产品是否真的已经“修炼”到了能够彻底替代早已成熟的磁带的地步呢?
  Enterprise Strategy Group的创始人兼资深分析师Steve Duplessie表示:“那些大公司将不断地将他们那些曾经保存在磁带库中的,数百TB的数据转移到新兴的磁盘系统上去。例如,我曾经接触过一个大型石油公司。他们就认为,如果将他们高达2.6PB容量的数据保存在由Engenio提供的磁盘系统上的话,与从磁带上完全恢复这些数据的成本相比,在磁盘系统上恢复的成本要相对低廉。”
  看来用户和业内人士对于磁盘系统的反应还不错。不过,我们的用户所面对的并不只是“是否需要将磁带系统更换为磁盘系统”这样一个单纯的选择性问题。除此以外,用户还要在众多的,针对不同存储应用(备份,归档或业务连续性等)而产生的不同种类的新兴磁盘存储系统中做出选择。这些新兴磁盘存储系统主要包括虚拟磁带库(Virtual Tape Library,VTL)、近线磁盘系统(Nearline disk system)、大规模非活动
磁盘阵列
(Massive Arrays of Inactive Disks或Massive Array of Idle Disks,MAID)、内容寻址存储(CAS)以及持续数据保护(Continuous Data Protection,CDP)技术等。
  虚拟磁带库(VTL)
  什么是VTL?简单地说,VTL技术就是一种能够让整个系统将磁盘存储设备识别为磁带设备的技术。它可以分别通过纯
软件
或软
硬件
相结合的方式来实现。我一直认为VTL是一种很“狡猾”的技术。它就如同打入敌人内部的奸细,表面上(对于前端系统来讲)非常磁带,但内心却十足地磁盘。很是高明!
  使用VTL技术的优点是显而易见的,它可以直接与企业现有的磁带备份软件以及底层连接设备相兼容。这就意味着VTL技术能够很好地保护近十年来的投资,不用彻底更换或马上升级那些老设备,而同时又能够获得高于磁带的备份/恢复速度。
  但同样的,任何技术都有它的弊端,一旦已有的VTL上的磁盘容量被占满,还是要将数据再次转移到磁带介质上的(从某种意义上讲,由于可以不断地增加介质数量,因此磁带系统的容量是无限的)。而这就有可能重新引发新的问题。
  针对现有的VTL技术,GlassHouse Technologies公司的W. Curtis Preston表达了他的看法:“即使我们假设VTL拥有足够使用的磁盘空间,企业最终还是会发现他们依然需要为那些已经不再使用的机器人磁带许可(robotic tape licenses)付费。厂商们总是力图让你相信部署VTL系统是多么轻而易举的事情。但事实上,如果真的想要达到理想的效果,就必须重新设计我们的这个系统。”
  如今的VTL,正在开始尝试与其它的一些先进的存储技术相结合,以求弥补它在应用中的缺失。例如,飞康(FalconStor)公司就已经将持续数据保护(CDP)技术集成到了它的VTL产品中。飞康公司的销售副主管Wendy Petty就认为,通过这种组合,今后的用户将完全可以在得到VTL技术所具有传统优势的同时,也拥有来自CDP技术的优势特性,即快速恢复。
  目前,已经有越来越多的厂商开始进入这一领域,其中包括:Sepaton、飞康、昆腾、ADIC、Diligent和Overland等。
  近线磁盘系统
  对于近线磁盘系统这种设备,我们完全可以把其看作是一种基于磁盘的,用于大型数据传输的“缓存”设备。也就是说,在数据被保存到磁带设备以前,将首先被传输到速度更快的磁盘系统中来,以消除整个系统由于磁带写入时速度过慢而造成的传输瓶颈。一般的近线磁盘系统都会使用相对成本较低的SATA磁盘来作为其存储的介质。
  近线存储系统的优势就在于它很好地解决了高性能与低成本之间的矛盾,能够以相对廉价的成本换取相应合理的性能提升。但同时,其所使用的SATA磁盘也引发了一场有关数据可靠性的争论。很多反对者就认为,由于ATA技术并非是针对企业级的高端应用而设计的技术,因此改为串行连接的SATA磁盘依然不能够替代高端的SCSI磁盘而出现在企业级的存储设备中。但这种看法,显然曲解了SATA的原始定位。正如我们前面所提到的:“以相对廉价的成本换取了相应合理的性能提升”,SATA的所有特性(相对低廉的价格,很大的容量,更快的速度)其实都是针对于磁带介质而言的。事实上,也正是由于SATA的出现,才打乱了磁带与磁盘之间原本各司其职,相安无事的局面。并且在技术的互补方面,还可以通过使用不同等级的RAID来对SATA的缺陷进行弥补
  然而,把廉价的磁盘系统仅仅作为整个系统中的“缓存”来使用,这并不能达到所有用户的要求,他们还有更高的期望,即一套整合了各种技术优势的完整的备份
解决方案
。目前,已经有越来越多的厂商推出了基于磁盘系统的完整的备份解决方案来满足市场的需要。“更长的保存期限以及更低的故障率,这些都是磁带介质所不具备的优势。最主要的还是D2D设备的速度优势,这让它成为了那些急于进一步缩短备份窗口的用户最终的选择。”Unitrends公司的产品主管Mark Phillippi这样说道。
  大规模非活动磁盘阵列(MAID)
  MAID技术最直接的作用就是为大型阵列的磁盘提供了“随需启动”的功能。MAID中的每一块磁盘只有在系统需要对其进行数据存取的时候才会启动,而平时的大部分时间,磁盘都会处于断电状态。这点和磁带库中磁带介质的工作状态很相似。这样做最大的好处就是大大节省了磁盘系统的耗电量,进一步降低了磁盘系统的使用成本。
  我们以COPAN系统公司的Revolution 200T为例,它最多能够装载896块磁盘驱动器(每块的容量为250GB),最大容量为224TB。使用此技术,用户能够同时访问这个磁盘库中25%的数据;而如果是改为使用磁带库的话,这个数字仅为1% 。同时,MAID还同时拥有很多VTL的特性。在COPAN的设备前端,就拥有一个VTL平台。
  COPAN公司的首席工程师Chris Santilli表示,即使在所有的磁盘都处于断电的非使用状态下,此系统依然会不间断地对这些磁盘进行监控,以确保所有的数据都随时可用。一旦发生数据错误,RAID将会及时发现并进行修复。而对于磁带介质来讲,我们无法对处于闲置状态的磁带进行数据监控,同时也不可能连续几年都使用同一批磁带的,因为如果这样,就会很容易造成数据恢复时的失败。而对于那些需要保存归档数据(一次写入后,偶尔访问),却又无法忍受过慢的磁带速度的用户来讲,MAID无疑是他们最好的选择。
  不过令人感到遗憾的是,一套MAID的起始售价就在12万美元左右,因此目前MAID的目标客户群仅为那些大型企业。
  内容寻址存储(CAS)
  CAS为我们提供了一种快速访问某些特定数据的方式,它区别于传统文件系统的最主要特征就是使用了所谓的内容寻址(Content Addressing)技术—— 即通过使用那些由内容源数据所生成的数字标签来进行数据寻址。目前,在CAS领域最有实力的厂商应数EMC,同时它也是这项技术的最早发起者(2002年 4月推出Centera)。随后,其他的众多厂商也纷纷加入到这个领域中,其中包括IBM、HP、Kasten Chase、StorageTek、Archivas、Permabit、Avamar等。
  说到CAS的最主要优势,以下几方面不能不提:
  1. 能够确保所保存内容的高可靠性;
  2. 为寻址提供了与数据内容相关联的惟一标识符;
  3. 只保存多个相同数据的单一副本和映像。
  但是,由于新技术的标准化高度未能达成,会在实际应用上给用户造成困扰。因为到目前为止,在CAS的实现技术上还没有两家厂商可以达到完全一致。由此就造成了市场上来自不同厂商的CAS产品均不能相互兼容的状况。
  目前,CAS的重点应用领域主要集中在医疗影像、电子邮件归档、企业级文件管理
  或那些需要对大量固定内容进行快速访问的领域。但它并不会代替传统的数据库环境。
  容量优化存储(COS)
  以Data Domain为代表的一些厂商目前正在大力鼓吹一项不同于CAS的新技术——容量最优化存储COS(Capacity Optimized Storage)。据来自Data Domain公司的行销主管Bart Bartlett表示,由于使用了全新的压缩及过滤技术,因此他们新推出的Data Domain DD400系列磁盘备份系统能够自动减少20%的备份次数。
  “这是一种应对如今数据急速增长的好方法。它的基本原理很简单,就是对于已经备份过的数据,系统将不再对其进行备份,而只是为其添加一个指向原始数据副本的指示器。Data Domain DD400将对待备份数据进行低于块级(sub-block level)的检查,然后再进行数据压缩,最终进行增量备份。通常进行增量备份的数据量仅为压缩前的1/6(这并不包括初次进行的全备份),” Bartlett表示。
  由此我们可以看到,目前各种基于磁盘的存储技术正在不断地涌现出来,并且无一不把矛头指向了有着“悠久”历史的磁带产品,想要取而代之。磁盘阵营中果然英雄辈出、人才济济呀。看来磁带的麻烦还真是不小呀!但到底谁能成为磁带的终结者,又或者是否存在磁带的终结者,我们到此依然不可妄下定论。但可以肯定的是,任何技术在其发展中的任何一个阶段,都会同时具备优势和弊端两个方面。我们不可以盲目地认为所有的新兴技术在各种应用领域都肯定会优于那些成熟的老技术。下面我们就通过对D2D/D2D2T的分析,来看看那些新兴的磁盘技术到底能给我们带来什么样的惊喜与期待,又有哪些不尽如人意的地方需要弥补。
  D2D/D2D2T——最近比较红
  毋庸质疑,如今的D2D(Disk-to-Disk)技术确实为解决传统的备份/恢复工作提供了更好的方法。它不仅可以有效地缩短备份时间,提高存储管理员的工作效率,而且还能在很大程度上减少由于备份工作失败所带来的风险。
  在以下的讨论中,我们将把D2D(Disk-to-Disk)和D2D2T(Disk-to- Disk-to-Tape)这两种技术放在一起作为一种设备来讨论。虽然它们之间依然存在着一些技术上的细微差异,但是实现的原理和应用的领域基本上是一致的。首先,在此技术中有一点是很明确的,那就是D2D设备并没有专门的机械装置来负责将数据从D2D设备上转移到磁带介质上面去。这也就意味着,如果你选用了D2D设备,并且还有要将某些数据转移到磁带介质上的需要,那么你就必须使用额外的备份
服务器
和磁带设备来完成这项将数据向磁带转移的工作(这个过程并不牵扯到你的D2D设备)。当然还有另外一种情况,那就是你的备份软件能够将你的D2D设备作为磁带设备的目标数据源
  而在这一方面,与D2D设备相对应的是,D2D2T设备的后端通常可以与SAN或直接与磁带驱动器/磁带库相连(此连接通常情况下是通过FC来实现的)。在备份软件或D2D2T设备自有的相应功能控制下,数据自动地完成从D2D2T设备中向外部转移的工作。因此,在本段论述中,如果不专门涉及到是D2D2T设备的话,我们都将统一使用D2D来表示此技术。
  虽然,在如今的数据备份/恢复领域中,D2D技术拥有很多显而易见的优势。但是事实上它并非可以解决所有的备份问题。IT经理们经常能够听到存储厂商在他们面前夸耀自己的D2D产品如何具有吸引力。例如,它们是具有如此低的成本;却又拥有如此快的恢复数据的速度;简直可以轻而易举地马上取代现有的磁带产品等等。但是在这些充满诱惑力的优势背后,有一点是应该引起我们注意的:那就是无论我们面对着一个拥有多少优点的产品或技术,我们首先最应该做的就是保持一个清醒的态度,没有任何新技术是十全十
美的
,忘掉厂商的形容词,淡化那些诱人的数字,认真面对你的需要,仔细权衡要得到它你所要需要付出的代价和它所能为你带来的收益。
  D2D真有那么好吗?
  最近,Diogenes Analytical Laboratory的专家们对来自7个厂商的8种不同的D2D设备和D2D2T设备进行了测试。对于测试结果,这些不同的产品和技术在各个方面所表现出来的巨大差异,让我们觉得十分惊讶,但同时也感到十分欣慰。因为正是由于这些产品和技术之间存在的种种巨大的差异,才为我们的用户带来了更大的选择空间,让我们可以随需应变。而如果某种产品或技术的市场选择空间变得越来越狭小,那么可以预见这个市场也将会变得越来越混乱,越来越多诉讼与反诉讼将会充斥其间。
  不管在任何时候,如果有一个厂商对外宣称他们可以为客户提供更低的TCO(总体拥有成本)的时候,一定马上会有人质疑说“你所谓的更低是在何种条件下与谁相比较而得出的呢?”当然,在大多数情况下“什么都不做”是获得最低成本的最有效途径。当你 “什么都不做”时,就不会产生任何购买成本、培训成本以及专业性劳务成本。但显然,“什么都不做”的后果就是会为我们带来更大的风险和更高的运营成本。同时,“什么都不做”往往只是在没有相应预算或根本没有资金的情况下所做出的迫不得已的选择。在更多的情况下,所谓更低的TCO通过是指与同时期市场上相类似的产品,相近的技术或行业中竞争力最弱的对手所比较而得出的,因为最弱的对手必然会因其在技术和服务等方面的缺失而大大提高其总体成本。
  具体到D2D的实际情况中,它所谓的可以提供更低的TCO并非意味着可以带来绝对的金钱上的节省。事实上,我们认为D2D对于如今的存储市场来讲应该是一种“AND”的技术,而并非是一种“OR”的技术。尽管由于D2D的出现,解除了以往管理员必须每天定时到现场更换磁带的麻烦,但是D2D并非是一种可以完全取代现有磁带产品的技术。现在,大多数媒体级和企业级的数据中心经常会花费数十万美金来购置D2D系统。当然,D2D2T设备(例如虚拟磁带库)确实能够极大地提高磁带的实际利用率(Tape-packing rates),而这种改善所带来的结果也确实能够在很大程度上减少那些需要我们进行管理的磁带的数量,但这并不会降低实施D2D2T系统的总体成本。值得注意的是,在我们满怀期待地将这套价值不菲的新系统请进我们的数据中心,并连接到已有SAN上的时候,我们还必须要为它提供更多的FC端口、更多的线缆等设备。没错!D2D技术确实是每一个数据中心都应该去认真考虑的新技术。但是用户还是不要对实施了D2D技术后就能够大幅降低你的IT预算抱有太大的幻想。
  D2D的备份速度
  关于D2D设备的备份速度,有很多准确可信的测试数据,它们往往都显示了如今的D2D设备的备份速度是普通磁带系统的10倍。但是,如果在现实中只注意到这些看上去十分令人满意的数字,我们的IT经理们往往就会被其误导,认为这个速度就是我们将会在D2D设备中得到的真实体验。当然,如果以一套高端的D2D系统与那些被胡乱设置或根本就不具有可比性的低端磁带系统进行对比的话,其结果确实可以达到让人惊讶并满怀期待的效果。但是,我还是要建议我们的IT经理们要保持冷静,要看到更深层次的性能问题。
  在对这些各种各样的D2D产品的测试中,Diogenes Analytical Laboratory并没有选择产品所标注的基本性能指标作为评估的一部分。原因是他们认为那些标注的基本指标往往并不能反映在实际操作中产品所表现的真实状况。在大多数情况下,我们要对某些系统的传输速度进行测试。例如在某次测试中,他们发现数据的真实传输率仅为35MB/s。这听起来确实让人非常沮丧,要知道这个速度仅与一个单独的LTO-2磁带驱动器的传输速率相当。
  这个数字让我们更深刻地意识到对整个相关的存储系统的调试工作对于D2D系统性能的重要性,而此项工作的重要程度甚至高于对磁带系统进行调试的重要性。系统管理员们依然需要对整个备份环节中所涉及的每一个方面进行优化。这些方面包括:
  * 备份/介质服务器 如果在备份过程中,服务器的
处理器
使用率已经达到或超过了80%,那么就应该及时升级服务器的处理器和
内存

  *
网络
带宽 网络连接(不论是LAN还是SAN)的速率必须能够满足数据传输的需要。
  * 目标设备的速率 目标设备(不论是磁盘还是磁带)必须能够应付与之相连的设备的传输速度,以便及时读写数据。
  * 数据源设备的输出速度 作为数据源的阵列与备份服务器之间的传输速率,应该要高于D2D系统中其他部分的传输速率。
  这四方面往往是影响备份性能问题的最普通的因素。如果其中的一方面没有被解决好的话,那这一方面就会像水桶上最短的那片木板,成为整个系统的瓶颈。在我们的测试中,问题往往被发现是出现在备份服务器身上,而并非那些D2D设备。
  D2D/D2D2T的优势
  在测试中,Diogenes Analytical Laboratory还发现,只要系统整体的传输速率高于磁带性能,我们就能够体验到D2D技术所带来的多项优势。例如,单独的文件恢复工作总是可以在瞬间完成。因为这个过程不需要涉及到找磁带,读取磁带或扫描磁带这些步骤。但是在完成需要
移动
大量的数据卷的工作的时候(例如恢复整个的数据库或系统),系统整体的传输速率就成了一个决定性的问题。此外,D2D系统还省去了以往磁带产品所带来的“擦皮鞋”(指磁带不断地启/停)或“回倒”等一系列麻烦。
  D2D(磁盘到磁盘)
  D2D技术通常是通过使用相应的设备来实现的。而这些设备中所使用的阵列往往是由廉价的ATA 或Serial ATA(SATA)磁盘驱动器所组成的。在大多数情况下,D2D设备是与磁带设备不同的。D2D设备拥有专门的软件来管理整个系统和数据的传输。同时,这些D2D设备几乎都支持其他软件厂商的备份/恢复软件,来帮助系统从主要的存储资源处来获得数据。而且在某些情况下,D2D设备也可以通过使用复制软件来在不同的设备之间进行数据转移(包括本地和远程复制)。
  在大多数情况下,D2D设备对于标准的备份/恢复任务来讲,是目标存储设备。因此它们往往被人们看作是很“温顺”的设备。在现实的大多数(并非全部)情况中的确如此。并且,使用D2D设备规划备份/恢复工作并不比直接到磁带更困难。然而,如果存储管理员想要进行离线式的磁带保存,那么就必须规划一个D2D设备向磁带设备转移数据的子任务了。但是不管在什么情况下,所有由于备份/恢复应用而复制的数据都将在备份/恢复的目录中被记录和管理,这就大大简化了以往的管理工作。事实上,对于D2D设备来讲,每天需要我们做的就只是进行一次最初的 “Setup”和配置就可以了。
  而对于D2D备份方式来讲,一个主要的不利因素就是它需要进行第二次的数据转移(如果存储管理员想要对数据进行离线式的磁带保存的话)。一般来讲,用户可以有两种选择:第一,可以先让数据写入磁盘,然后再从磁盘写入磁带中。第二,这两个过程也可以同时进行。如果执行第二种选择,那么备份服务器将要同时处理这两个任务。另外,在数据流最大的时候,所需要的带宽将可能达到平时的两倍。如果是第一种磁盘和磁带进行顺序复制的情况的话,那么系统的处理时间也将会加倍。同时离线磁带的转移工作也会被延长一段时间。并且这还会增加数据丢失的风险。
  D2D2T(磁盘到磁盘到磁带)
  由于D2D2T设备自身拥有将数据转移到磁带介质上的能力,因此相对于单独使用D2D设备来讲,D2D2T设备在应用上为我们提供了更多的可能性。此外,几乎所有的D2D2T设备都能够以磁带格式来记录数据,并且模仿带库级的磁带设备。这就使得通过D2D2T设备向磁带设备转移数据的任务变得异常地轻松。而实际上,对于那些始终运转的备份恢复应用而言,这些D2D2T完全就是普通的磁带设备。
  在某种意义上讲,D2D2T的特性与前面我们所说的D2D的特性正好相反。它拥有专门的单元和程序来负责将数据从磁盘上转移到磁带上。并且整个过程并不会对备份服务器造成不必要的负担。在有些情况下,D2D2T设备中的数据并不一定要等到对主数据源的备份任务彻底完成以后,才能够开始向磁带设备转移。这样就大大的缩短了由于磁盘拷贝与磁带拷贝之间的不同步而产生的时间延误。当然,这整个过程依然不会对你的服务器和网络造成任何影响。此外,在整个数据的迁移过程中,D2D2T设备能够随时对处于任何阶段的数据进行管理。
  D2D/D2D2T伴生的问题
  当然,以上所说的这些优势都是有代价的。我们在享用这些D2D2T设备所带来的新功能的同时,也要承受随之而来的一些问题。并且有些问题并不简单!如果一个存储管理员因其提供的先进功能而决定选择使用某一D2D2T设备时,请在正式实施决定之前,一定要先弄清楚,这些先进的功能,经常是不在原先的那些备份/恢复程序控制管理范围之内的。例如,在D2D2T设备完全自主地(整个过程没有其他设备或应用的干预)将数据转移到磁带上的这一过程中,系统中的备份/恢复程序对这些在磁带介质上新产生的备份数据却一无所知,这就增加了出现单点故障的风险。因为一旦D2D2T设备出现了故障,那么其上面的备份数据将完全不可用。除此以外,系统中的那些备份/恢复软件对于已经保存在磁带介质上的备份数据同样也是一无所知的(因此一样无法管理和访问)。因此,多数IT组织都会建议用户在部署D2D2T时做好冗余,以确保数据的高可用性。
  我们可能会遇到的麻烦还远没有结束。有些D2D2T设备会支持虚拟条码,这一般会表现为两种形式:一种是设备对磁带上的物理条码进行1∶1的完全扫描复制;另一种就是由D2D2T设备生成一个与物理条码相关的逻辑列表。在第一种情况下,一旦某盘磁带发生故障,那么就会产生问题,因为在这种情况下,管理员要么在两边的系统(D2D2T和磁带设备)上进行全部物理条码的重新复制映射(这是由于系统中加入了具有不同条码的新的磁带以替换出故障的磁带),要么就将故障磁带上的条码标签撕下,贴到新的磁带上面,而这个过程,极有可能造成条码的物理损坏。如果是第二种情况的话,一旦D2D2T设备发生故障,就会带来更大的麻烦。这是因为那些传统的备份/恢复软件将无法读取那些由D2D2T设备生成的磁带条码逻辑列表及其相对应的物理磁带。
  最后还可能发生在D2D2T设备身上的问题就是在进行数据恢复的过程中,磁带上的数据在恢复到系统主磁盘上之前,会先恢复到D2D2T设备上,然后再由其转发到主磁盘上。我们都了解,在数据恢复中多了一个环节就意味着多了一个可能发生问题的隐患。因此在这里,D2D2T设备再一次成为了可能发生单点故障的平台。除此以外,就算是所有设备运转正常,增加的这个中间过渡程序也会增加整个恢复所需要的时间。而如果说D2D2T技术减少了备份时间的话,那么同样的,它却增加了恢复的时间。
  最终我们发现,对于到底是应该选择D2D2T设备还是D2D设备,根本就得不到一个明确的答案。所谓正确的方案就是合适的方案,这取决于最终用户的具体需求和满足这些需求的详细的整体的实施方案。一般来讲,D2D的备份恢复方案提供了简单确定的应用,但功能相对单一。而D2D2T设备在功能上虽然要强于D2D设备,却也同时带来了管理上的复杂性和应用上的风险性。并且,相对于磁带而言,它们也并没有像厂商们所宣称的那样完美和激动人心,很多问题都尚待解决。
  通过以上的介绍,我发现正如本篇开始时所预料的那样,这些“新”的磁盘阵营中的“猛将”们虽然每个都各怀绝技,初生牛犊,但也确实存在许多不够老练,不够成熟的通病。不过还是可以明显地看出,如今的磁盘技术的实力正在不断地增强,同时人气也越来越旺。对磁带技术产生了足够大的威胁。不过现在我们依然不可妄下结论,毕竟这场战争的另一位主角还未出场。下面我们就来看看磁带是如何进行它的“绝地大反攻”的。
  备份市场,磁带沦陷?
  最近,美国的一些银行和期刊出版社,都不约而同地考虑或已经将自己原先的磁带设备“升级”为那些以磁盘为基础的备份产品(如虚拟磁带库或在线远程备份设备)。那么这是否就意味着现有的磁带备份产品的“大限”已至;基于磁盘的各类产品将在备份应用领域内彻底地取代曾经主流的磁带产品呢?
  Lasso Logic公司(一家为中小企业开发备份软件产品的公司)的CEO Steve Goodman就是这种观点的坚决拥护者。由他所在的公司开发的,面向中小企业的持续数据保护产品在刚刚面世的头一个月,就已经卖出了40套,并且还有 40位客户对这套能够帮助他们完成在远程地点的数据备份方案表示出了浓厚的兴趣。Steve Goodman认为,如今的中小企业需要的是一种易于使用、易于维护、快速响应并且能够及时快速恢复的备份解决方案。因此在这几方面均处于劣势的传统磁带产品就将逐渐退出备份这个领域。除此以外,其他的一些磁盘厂商们,如Bus-Tech(磁盘备份产品及数据中心连接产品供应商)、Sepaton(一家从名字——反过来是“NoTapes”——就能看出其坚决抵制磁带决心的虚拟带库厂商)也都在不停地加紧步伐,努力创造着一个无磁带的备份世界。
  “最近,有很多关于磁带的负面报道指出,因磁带的丢失或被盗(主要发生在运输过程中)而造成的数据遗失事件正在成上升
趋势
。”Sepaton公司的行销副总裁Linda Mentzer说道,因此针对这一问题,Sepaton将会马上为自己的虚拟带库产品增加远程备份功能,即通过dark fiber(裸
光纤
)或WAN,为处于异地之间的两台或多台虚拟带库传输数据。同时他还表示,据他们的调查显示,几乎所有的大型企业用户,都对他们的这项新技术表示了浓厚的兴趣。
  来自Bus-Tech公司的行销主管Jim O'Connor也传达了同样的看法。他说:“今后,用户的目光将主要集中在我们这些磁盘厂商的身上。现在已经有越来越多的用户已经或打算淘汰掉他们原先的磁带产品了。”
  Vanderbilt大学在过去的三年中,已经逐步更换了原有的磁带设备,而全部改用Bus- Tech公司所提供的虚拟磁带产品了。当谈到此事时,售后服务经理Ron Eastes就曾开玩笑地表示,如果非要说更换完磁盘备份设备后出现了哪些让人沮丧的问题的话,那就是由于相对于传统磁带而言,如今的备份时间的大幅减少,使得相关人员的工作量也随之减少。因此他们不得不解雇了两名原先在数据中心负责备份的工作人员。
  看来局势似乎对磁带这方并不十分有利。磁盘所具有的优势果真在备份战场上发挥了极大的作用。用户们在备份这个问题上纷纷“见盘思迁”。磁带的防线是否就此功亏一篑了呢?
  磁带是否还有机会?
  就在越来越多的人开始密切关注基于磁盘或者远程备份的同时,还有相当比例的用户也表示了他们目前并不打算完全更换现有磁带设备的想法。在他们看来,如今的磁带产品依然还具有低成本,介质易于移动等优势。
  在昆腾公司于今年三月进行的,针对500家中小企业用户的调查中,我们发现,只有8%的IT经理表示将很有可能购买全新的在线备份方案。有一半的用户表示他们目前还没有更换磁带产品的打算。同时也是来自昆腾公司的另一份针对大企业的调查表明,在这些都已经开始使用了基于磁盘的备份的企业中,仍然有80%的用户依然在归档应用中坚持使用磁带产品。
  “我并不认为磁带的末日将要来临了!”昆腾公司的市场部经理Mark O'Malley坚定地表示。他认为,虽然目前各个大型企业都已经或正在建立D2D的远程镜像系统,以增强数据的保护和恢复能力。但是,大多数企业是没有足够的资金来建立完整的远程镜像系统的。并且即使是那些已经建立了完整的远程镜像系统的企业,也并没有完全抛弃原有的磁带系统。“他们中的绝大部分是并不会放弃磁带的。他们只不过将磁带应用在了非备份领域。人们依然需要一份离线的数据拷贝。”并且对于那些资金有限的中小企业来讲,相对于SATA加MAID (Multiple Array of Idle Disks)的组合,磁带方案依然十分廉价,深具优势。
  现在的事实是,有一些用户完全将备份设备由磁带系统更新换代变成了磁盘系统;而另一些用户则是在现有磁带系统的基础上,新增加了磁盘系统。但是,对于他们而言,依然还是会继续使用具有低成本、易移动并且适宜长期保存的磁带介质来保存归档数据的。
  设备不是全部!
  无论使用怎样的解决方案,不论是厂商还是用户,有一点是需要再次强调的,那就是人在整个存储应用中的作用。来自Enterprise Strategy Group的分析家Peter Gerr曾在今年三月做过一个调查,在调查中显示,有18%的最终用户已经将部分的磁带产品更换为了基于磁盘的产品;有58%的用户表示正在考虑更换。但是Gerr认为,现在的问题并不只是简单的选磁盘还是选磁带的问题。那些有着各种急切需求的企业们应该好好反思一下,他们是否能够真正做到善待自己的数据呢?
  每当我们开始抱怨由于磁带丢失、被盗或损坏而导致的数据不可用的时候。我们是否应该反问一下自己这一切到底是谁造成的呢?我们是否真的像我们所说的那样重视并谨慎地对待了那些载有重要数据的介质呢?当那些我们平时的小疏忽,逐渐积累而最终造成了严重的后果时,我们能做的是否只能是升级我们的存储设备呢?这确实能够从根本上杜绝错误的再次发生吗?据一份来自ESG的调查显示,只有7%的被访者平时有对备份数据进行加密的习惯。而60%的人表示他们从未做过。
  事实上,在我们身边存在着太多的不当保存或保护数据的习惯,因此而发生的错误与所使用的存储介质根本是无关的。正是这些不当的使用习惯对我们的重要数据造成了很大的威胁,并且进一步伤害了用户的利益和信心。对于数据的安全问题,我们应该比那些机器负更多的责任!
  磁带马上就会消失?——决不!
  关于磁带将被磁盘取代的说法并非是这几年才开始讨论的。早在上世纪90年代中期,由于当时3.5英寸磁盘的存储密度不断增长,因此就有一些存储厂商宣称磁带的“死期”将至。
  我还清晰地记得当时的一位存储厂商的销售经理对我说过这样的话,“那些想要在磁带上保存 30TB归档数据的用户真是不明智!他们应该用磁盘来代替那些过时的磁带产品。要知道磁带马上就要完蛋了!”而10年后的今天,我的这位朋友已经跳槽到了一个新的公司,并销售最新的磁带产品。而当时那个被他所不屑的“愚蠢”客户,如今已经在磁带上保存了近2PB的归档数据了。
  没错!在这些年中,不管那些磁盘设备厂商如何努力,都没能将老对手“磁带”送进“坟墓”。如今,磁带依然是在存储市场上占有大量的份额,并且在可预见的将来,磁带产品也不会马上消失。诸如成本、容量、性能、耗电、便携性和带宽等一系列因素都将决定磁带将来的命运,并不会早早退出存储市场的历史舞台。
  磁盘容量增势
  下面这张图表显示了
希捷
(Seagate)公司的SCSI和FC磁盘容量在近15年中的增长趋势:
  正像你所看到的那样,在近五年中,磁盘容量的年增长速率一直在不断地下降,并且这种趋势还在愈演愈烈。照这种情形看来,下一次单个磁盘容量增加的结果将很有可能是只达到400GB(FC磁盘),而并非600GB。因此15年来,每次都是成倍提升磁盘容量的惯例将有可能被打破。这就意味着,我们将很快地看到,曾经磁盘较磁带在单介质容量上的优势将逐渐被弱化。
  除此以外,耗电也是另一个需要我们考虑的问题。根据希捷网站上公布的数据,一块300GB的FC磁盘在使用的时候的耗电量为18瓦,非工作状态为12.2瓦左右。我们稍后会讨论关于耗电量所带来的问题。
  磁带的优势:容量、能耗和移动
  众所周知,在过去的30年间,磁带存储密度(只考虑非压缩的情况下)的增长速度始终跟不上磁盘的步伐。当然,你可能会说磁带上的压缩技术正在变得越来越强大。但是正如所有的存储厂商一致的看法,磁带的压缩技术并不是适用于任何用户。因为,有些类型的数据是无法被压缩的。因此我认为只有磁带的非压缩容量才具有实际的参考价值。而其压缩的功能再强大也就只是个附加功能而已。
  下面的表格显示了这些年来那些具有代表性的磁带产品容量的增长数据。需要说明的一点就是,如果同年中出现了多种的新磁带产品,我们只统计容量最高的那一个。
  你一定已经发现了,磁带容量的增长并不像磁盘那样规律,而是非常具有跳跃性的。不过从总体形势看来,随着时间的推移,磁带容量所显示出来的增长势头还是让人比较满意的。据悉,Imation和LTO协会已经对外宣布了最新一代具有更高存储密度的磁带技术的开发计划。不过Roadmap只是一个参考,除非你已经按照它所列的时间表购得了你所期待的产品,否则就不要完全相信这个东西,它只具有参考价值。对于推出新的提升存储密度的技术,在我的印象中,几乎是没有几次能够如约而至的。当然我们也不能完全抛弃Roadmap,要不然我们怎么知道这一次它是否又“不守时”了呢?
  能耗、可靠性和移动性
  现在我们来讨论一下关于能耗的问题。我们以一个存储容量为100TB的磁盘系统为例:假设我们使用的是容量为300GB的磁盘来组成4+1的RAID-5冗余阵列为一个LUN。我们来估算一下这个磁盘系统的耗电量:
  100TB/1.2TB每个LUN(4×300GB)= 84个LUN
  84个LUN×5 = 420个磁盘
  在通常情况下,我们还会在系统中加入一些处于运转状态的备用磁盘,因此磁盘总数应该在425个左右。按照我们在上文中所提到的,希捷公司在网站上所公布的处于运转状态的300GB磁盘的耗电量为18瓦计算。425个磁盘耗电的总合就是7.65千瓦。这还不包括那些RAID控制器、
空调
设备和冷却风扇的耗电量。并且这些设备的耗电总和要远远高于单纯磁盘驱动器的耗电量。况且又逢这些年来全球能源短缺,电价的不断升高等因素的影响。因此,能耗成本将成为我们必须要考虑的一个重要问题。
  虽然我们在前面所介绍的MAID技术可以部分解决这个问题,但磁带产品不需要让所有的磁带介质以及机械臂始终保持工作状态的特点仍然占有明显优势。这相对于时刻处于运转状态的磁盘介质来讲,使用磁带产品将为我们节省大量的能耗成本。
  说到这里,一定会有人站出来说:磁带的可靠性可是没有磁盘好呀!我想我们应该从不同的方面来看待这个问题。经常被提出的一个问题就是,有多少人曾将磁盘介质远距离地转移过?答案几乎是否定的。但是磁带便于移动的特点就使得我们能够非常容易地远距离转移它——当然,这也容易造成磁带介质的丢失或被盗。同时,由于磁盘介质拥有更多、更复杂的机械结构,其抗震性能要远远低于磁带介质。
  磁盘与磁带的分野
  看来磁带并没有轻言放弃,其技术的发展反而越来越有生命力了。可谓“老当益壮”。不过文章写到这里,我们对于磁带于磁盘双方的形势虽然有了总体上的了解,但还是没有得到结论性的对比分析。那是因为所有以上的内容,包括:二者所具有的优劣势、人们的主观评价以及各种系统的数据信息,都可以看作是表面上的现象。下面我们就要进一步地讨论一下磁带于磁盘二者之间的本质差异。
  首先我们需要明确的是磁盘与磁带两种存储技术之间的本质区别是什么?
  1. 在线介质与离线介质的区别。
  2. 随机读写和顺序读写的区别。
  对于在线和离线,我们可以进一步把其看作是介质的动态与静态介质之间的差异。也正是由于存在这样的差异,才使得磁带介质灵活性(便于运输)要大大强于磁盘,有利于数据的远距离异地保存。还有就是在线介质上的数据会受到系统的检测,而离线了的介质就无法做到这点。对于第二点来讲,不同数据读写类型决定了读写不同类型数据的速度,以及各自适应的应用领域。具体说来就是:随机读写更适用于高频率、小数据量的读写工作,而顺序读写则更适用于长时间的高速大量数据传输。本质区别所带来的是绝对优势,并且这种优势是始终存在的。
  下面我们再来分析一下他们之间的相对不同之处。其中包括有:速度、容量、成本和安全性等方面。相对不同所带来的是一种相对优势,这种相对优势是会随着环境中各种因素的变化而变化的,存在着较大的弹性,是需要具体问题具体分析的。因此大多基于相对优势而产生的结论往往是具有争议性。同时它们也是经常被我们所误解的地方。例如用户们最关心的速度和容量问题。通过前面的文章,我们就能发现在这两方面,它们二者的差异其实并非我们曾经想象的那么大。
  我们还经常会固执的坚信“磁带=低成本”。在这里我们应该首先明确的就是这个“成本”的具体含义。如果只把它狭义地理解为“介质上的每GB成本”的话,那么上面的等式完全成立。但是这似乎毫无意义,因为没有人会只采购存储介质的。我们需要比较的是整个数据存储解决方案的TCO(总体拥有成本)。TCO中包括方案的实际采购价格和以后的使用成本两个大部分。但由于不同用户的实际情况均各有差异,如实际采购价格往往各不相同,有时甚至会有很大差距。同时来自不同厂商的不同销售策略也紧密关系到最终的实际价格。还有就是不同地区或公司的人员培训成本、专业性劳动成本甚至能源成本均有差异。除此以外,不同的方案还会产生许多各自意想不到的连带成本。所以完全客观地比较实施磁盘和磁带方案的总体成本是十分困难的。这就是上面所说的相对不同。
  因此对于所有的相对不同,如果没有联系具体应用而凭空比较的话,最终总是会变成一场没有结论的口舌之争。
  归档——磁带的未来
  有了前面的分析,由于其二者在技术上的根本差异,我们就不难认清磁盘和磁带目前所处的局势了:对于磁盘来讲,在线介质和随机读写的特性完全适用于当今的备份/恢复应用,而磁带的离线介质和顺序读写的特性显然就是归档应用最佳人选。
  说到这里可能有人会认为失去备份市场的磁带厂商今后的状况也许不容乐观。其实如果我们清楚所谓备份和归档之间的区别的话,就会发现这种担心完全大可不必。首先,备份数据的保留期限可能是以星期或月为单位计算的,而归档数据要保留的时间是以年甚至世纪来计算的;其次,备份的目的是为了在遇到故障或灾难时进行数据恢复,而归档则要保证取回数据的可用性。备份数据总是在一个固定周期中被不定地更换,因此用于保存备份数据的存储设备的总容量可以基本保持稳定。因此可以看作是一种短期的一次性投资。而归档数据总是处在不停地增长中。需要经常增加新的存储介质。是一种长期的计划性投资。同时今后每年的数据增长量将会逐年上升,再加上各种法规的相继出台和生效也将进一步提升数据归档的地位。因此未来的归档市场的潜力将绝对不容小视。我们对于磁带介质的需求量也将相应地逐年上升。所以说虽然表面上磁带将会逐渐退出曾经的备份领域,但在未来的离线长期归档市场中磁带的优势将得到最大程度的发挥。
  磁盘技术未来的情况将会怎样呢?许多新兴技术,如MAID正在逐渐进入我们的视线。因此有人会想到,磁盘会不会也进入到归档领域中去呢?事实上,MAID技术依然无法解决不能长距离转移磁盘介质的问题。并且目前的网络带宽成本问题依然是阻碍企业在远程范围内(城市之间或国家之间)转移大量数据的主要问题。事实上,这些年来,广域网的性能提升完全没有跟上磁盘和磁带存储容量的增长速度。这种不平衡仍然将在一段时间内持续,很难快速得到改善。因此存储介质的可移动性依然是个重要的问题。
  我相信在归档领域中,磁带是不会被磁盘存储技术取代的。也许在今后,MAID技术将会被广泛应用到一些大规模的备份应用中去。但是,我还是无法想象会有人把100多块的磁盘移动到很远的目的地去。并且同时还清楚地标明每块磁盘介质的mount和 mkfs参数。任何新技术都依然不能在各个方面做到完美,也都不可能完全取代已经发展成熟的老技术而独霸市场。
  技术的更新固然带给我们更多惊喜和方便,但一味的更新并不能达到实际的应用要求。一项技术的成熟必然要经历长时间的发展与完善,因此,对数据存储介质的选择上,需要权衡实际应用来进行。我们需要的是一种综合的,应用特性与介质特性相一致的,存储成本和信息价值相结合的分级存储策略。虽然我们已经可以肯定,给予磁盘的备份和恢复是数据保护的主流发展趋势。但磁带,仍然在存储市场,坐拥半壁江山。
  磁带、磁盘之间,彼此没有优劣,只是两种不同的技术。技术本身没有好与坏,只有是否适合应用。二者各司其职,并没有在某一领域内形成直接的竞争。二者之间所谓的争论,只是一场虚构的战争!


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/66684/showart_1661849.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP