免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: bbjmmj
打印 上一主题 下一主题

dedup是一个始终让人不放心的技术 [复制链接]

论坛徽章:
0
51 [报告]
发表于 2010-04-14 12:39 |只看该作者
回复 50# michael1983


要想做到完全的数据完整性也是可能的,比如建立hash桶,相同hash值后再比较数据块。当然这样的话,性能就要受影响。
现在普遍还是在hash函数方向努力,期望非常非常小的碰撞率或者无碰撞发生。
王小云教授一下把N多人都搞疯了,哈哈!

论坛徽章:
9
技术图书徽章
日期:2014-10-14 15:48:13数据库技术版块每日发帖之星
日期:2015-06-04 22:20:00数据库技术版块每日发帖之星
日期:2015-06-10 22:20:00数据库技术版块每日发帖之星
日期:2015-06-11 22:20:00数据库技术版块每日发帖之星
日期:2015-06-13 22:20:00IT运维版块每日发帖之星
日期:2015-09-22 06:20:00IT运维版块每日发帖之星
日期:2015-12-08 06:20:00综合交流区版块每日发帖之星
日期:2016-02-02 06:20:00IT运维版块每日发帖之星
日期:2016-07-25 06:20:00
52 [报告]
发表于 2010-04-14 13:22 |只看该作者
NO!NO!NO!王教授让大家都放心了,碰撞的几率仅为10的-21次方,大大低于硬盘出现坏扇区的几率,单就理论而言,DEDUP的哈西校验已经足够可靠。

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
53 [报告]
发表于 2010-04-14 17:28 |只看该作者
回复  michael1983


要想做到完全的数据完整性也是可能的,比如建立hash桶,相同hash值后再比较数据块 ...
liuag 发表于 2010-04-14 12:39



    几率再小,也是软层面的东西。
    硬盘故障的风险再大,也是硬件层面的东西,我们不能不用。
所以软层面的东西我们可以控制,大不了不用。用了导致问题出现,那就是决策者的责任了。
毕竟我们不用,就不会出现问题。
而硬层面的东西不能不用,所以有了raid,有了raid还是坏的话,那就没办法了。

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
54 [报告]
发表于 2010-04-14 17:32 |只看该作者
NO!NO!NO!王教授让大家都放心了,碰撞的几率仅为10的-21次方,大大低于硬盘出现坏扇区的几率,单就理论 ...
bbjmmj 发表于 2010-04-14 13:22



国人的骄傲!

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
55 [报告]
发表于 2010-04-14 18:49 |只看该作者
硬盘出现坏扇区可以靠做raid避免。

另外,担心现在有很多软件公司做的dedup产品就没考虑碰撞问题。

论坛徽章:
0
56 [报告]
发表于 2010-04-15 09:24 |只看该作者
硬盘出现坏扇区可以靠做raid避免。

另外,担心现在有很多软件公司做的dedup产品就没考虑碰撞问题。
无牙 发表于 2010-04-14 18:49



    恐怕这个才是关键呀,所有的碰撞概率都是理论上的,而在实际产品中,为了避免性能方面的影响,是否真的能到达理论的那个高度呢

论坛徽章:
0
57 [报告]
发表于 2010-04-15 09:53 |只看该作者
随着数据量的猛增,它必是个趋势,除非硬件的发展大大的超过数据的增长。

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
58 [报告]
发表于 2010-04-15 11:04 |只看该作者
硬盘出现坏扇区可以靠做raid避免。

另外,担心现在有很多软件公司做的dedup产品就没考虑碰撞问题。
无牙 发表于 2010-04-14 18:49



如果做了dedup,碰撞问题肯定是要考虑的。
否则那是对产品的一种不负责任呐
就是看考虑的全面不全面了。。。

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
59 [报告]
发表于 2010-04-15 11:05 |只看该作者
恐怕这个才是关键呀,所有的碰撞概率都是理论上的,而在实际产品中,为了避免性能方面的影响,是 ...
ry715 发表于 2010-04-15 09:24



    dedup本身就是一个以空间换性能的东西啊~~

论坛徽章:
10
处女座
日期:2015-01-22 16:08:50技术图书徽章
日期:2018-09-13 11:25:52技术图书徽章
日期:2018-09-13 11:25:45技术图书徽章
日期:2018-09-13 11:25:37技术图书徽章
日期:2018-09-13 11:25:29黑曼巴
日期:2018-06-04 09:03:192017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:03:402015年迎新春徽章
日期:2015-03-04 09:50:28技术图书徽章
日期:2018-09-13 11:26:01
60 [报告]
发表于 2010-04-15 11:07 |只看该作者
随着数据量的猛增,它必是个趋势,除非硬件的发展大大的超过数据的增长。
coolgo2010 发表于 2010-04-15 09:53



    确是有这种趋势
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP