- 论坛徽章:
- 0
|
原帖由 liyoujunlizi 于 2008-11-5 21:23 发表 ![]()
首先声明下,我绝对没有打广告的意思.
这是老大安排的任务,叫我看datadomain的重复删除技术, 看看它与Puredisk的区别. 到datadomain主页上看得太累,想听下大家的高见,学习下...
谢谢了.
不算特别了解,我先说我知道的
我想首先比较重要的一点是,datadomain的重复数据删除是和虚拟带库(VTL)接合使用的,换句话说,磁盘先被模拟成磁带,再进行备份。Puredisk我不知道是啥?是重复数据删除的厂商么?我没有听说过,如果按英文意思是裸磁盘备份的话,那么在这一点上就和datadomain有很大区别。至少VTL先把磁盘模拟成磁带,技术非常成熟,后台的磁盘备份目前技术还不是特别成熟,还有很多问题。
第二说重复数据删除,datadomain用的是在线的重复数据删除技术,就是数据在保存到磁盘以前就进行了冗余数据的删除。目前falcon、sepaton、还有avamar都是后处理模式,就是数据保存到磁盘之后才进行冗余数据删除的处理。这样做的好处是整个备份过程完成的速度快(包括进行重复数据删除的时间),不占用存储网络的带宽等等。但是要求比较好的硬件平台,要求很好的算法,是更加先进的重复数据删除技术。。。。应该说,datadomain的重复数据删除在业界的口碑还是不错。。。
更深入的说原理的话,好像是,他把文件拆分成一个一个的小的数据块,如果拆分出来的这些小的数据块有重复的,就只保存一份,并且保留了这些数据块如何组成文件的信息。而且还通过算法进行比对。。。。
太麻烦了,你可以参考这个帖子:
对话昆腾,重复数据删除底层技术,视频访谈全文
http://bbs.chinaunix.net/viewthr ... D%BE%DD%C9%BE%B3%FD |
|