免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: wiresnake
打印 上一主题 下一主题

[其他] 115网盘怎么判断两个文件是同一文件的 [复制链接]

论坛徽章:
1
射手座
日期:2014-08-04 16:49:43
11 [报告]
发表于 2012-11-01 16:41 |只看该作者
每个文件做一个索引,可以用HASH表, 重复的文件用类似指针代替..  重复数据删除-文件模式
跟存储服务器相通,早期的存储服务器就是这么做的,不过现在技术升级了,不是文件级别的了,而是块Block 级别的...

论坛徽章:
0
12 [报告]
发表于 2012-11-01 16:46 |只看该作者
hellioncu 发表于 2012-11-01 16:38
我的猜测:
客户端上传两个不同名的相同文件,如果第二个速度很快,那么应该是客户端计算的了SHA1之类 ...

我做DPI的,我把上传的流阻断了,如果一份文件之前已经上传过,然后把原来网盘的文件删除,它可以重新上传,即使改过名字,我觉得第二份文件不是从本地上传的,而是在115服务器那边保存进我网盘的

论坛徽章:
0
13 [报告]
发表于 2012-11-01 17:23 |只看该作者
呵呵。。。
这个东西其实没想象那么复杂吧

论坛徽章:
324
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
14 [报告]
发表于 2012-11-01 17:29 |只看该作者
sandljj 发表于 2012-11-01 17:23
呵呵。。。
这个东西其实没想象那么复杂吧


好陌生,好诱惑

论坛徽章:
2
技术图书徽章
日期:2013-09-04 15:21:51酉鸡
日期:2013-11-01 21:20:20
15 [报告]
发表于 2012-11-01 18:10 |只看该作者
hellioncu 发表于 2012-11-01 16:38
我的猜测:
客户端上传两个不同名的相同文件,如果第二个速度很快,那么应该是客户端计算的了SHA1之类 ...


你觉得保存一个计数器/指向占用空间多,还是保存多个文件副本占用空间多(不考虑冗余安全)?

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
16 [报告]
发表于 2012-11-01 19:57 |只看该作者
客户端算个md5去服务器问问就行了, 你以为开发这些应用的程序员都是神仙吗...

你看不到说明报文加密了, 这种应用能偷用户电脑的资料就偷, 让你看到岂不是很丢脸.

论坛徽章:
324
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
17 [报告]
发表于 2012-11-01 20:22 |只看该作者
mirnshi 发表于 2012-11-01 18:10
你觉得保存一个计数器/指向占用空间多,还是保存多个文件副本占用空间多(不考虑冗余安全)?


把别的115 ID分享的文件存到自己的网盘,当然是加一个引用而已。
但是针对个人上传的,在整个网盘中不一定能找到一样的,只用SHA1之类的值比较理论上存在误判。也许为了简单,实实在在存上一份也是有可能的。

论坛徽章:
2
技术图书徽章
日期:2013-09-04 15:21:51酉鸡
日期:2013-11-01 21:20:20
18 [报告]
发表于 2012-11-03 09:54 |只看该作者
hellioncu 发表于 2012-11-01 20:22
把别的115 ID分享的文件存到自己的网盘,当然是加一个引用而已。
但是针对个人上传的,在整个网盘中不 ...


如果是唯一的,自然要上传了。目前来看sha1还是能够确认唯一性的,否则好多软件/代码的唯一性就受质疑了。

论坛徽章:
324
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
19 [报告]
发表于 2012-11-03 10:07 |只看该作者
mirnshi 发表于 2012-11-03 09:54
如果是唯一的,自然要上传了。目前来看sha1还是能够确认唯一性的,否则好多软件/代码的唯一性就受质疑了 ...


SHA1相同不能证明文件相同,否则SHA1跟文件是一一映射了,那所有文件都可以压缩成SHA1那么长,可能么?

论坛徽章:
2
技术图书徽章
日期:2013-09-04 15:21:51酉鸡
日期:2013-11-01 21:20:20
20 [报告]
发表于 2012-11-03 10:55 |只看该作者
hellioncu 发表于 2012-11-03 10:07
SHA1相同不能证明文件相同,否则SHA1跟文件是一一映射了,那所有文件都可以压缩成SHA1那么长,可能么?


目前还没与找到sha1的碰撞. 套用你这种说法,每个人的指纹是唯一的,那么所有人都可以压缩成一个指纹
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP