免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: 兰花仙子
打印 上一主题 下一主题

原译:使用Bloom Filters [复制链接]

论坛徽章:
0
11 [报告]
发表于 2010-03-16 16:27 |只看该作者
Thanks!

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
12 [报告]
发表于 2010-12-07 22:35 |只看该作者
算法简单,不过应用非常有意思

论坛徽章:
3
未羊
日期:2013-11-18 15:17:06酉鸡
日期:2013-12-06 17:07:16天蝎座
日期:2014-06-11 12:37:07
13 [报告]
发表于 2013-08-05 12:14 |只看该作者
仙子,请教下关于容量的问题。
本来打算开一个帖子来请教你。
但是论坛搜索到了,就直接问了,说的不到位的话请包涵。。

我很好奇的一个问题是Bloom Filters的容量问题。
基本上Bloom Filters的功能我理解了,但是其中容量是一个必须限制的数字。
那么如果我的数字是一个不可预知的情况下,那怎么办呢?

正好比我在微薄上提问云舒的。

  1. 墨迹哥
  2. 其实我想问个问题,Bloom::Filter 这玩意设置了容量以后,一旦超出就异常了。那怎么办呢?是否能设置成一个N,永远不会有超出异常呢?@云舒 因为我没有办法知道目标网站链接有多少。
复制代码
对此我想请教下你,对于会容量超出的情况,仙子的解决方法是什么呢?

论坛徽章:
0
14 [报告]
发表于 2013-08-06 15:09 |只看该作者
墨迹哥 发表于 2013-08-05 12:14
仙子,请教下关于容量的问题。
本来打算开一个帖子来请教你。
但是论坛搜索到了,就直接问了,说的不到位 ...


晕啊 我好久没用这种算法了,要重新看下。BF相对于LRU而言,更高效,但是碰撞的概率也大些。

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
15 [报告]
发表于 2013-08-07 05:45 |只看该作者
兰花得太精彩了,先收藏,有时间学习学习。

论坛徽章:
3
未羊
日期:2013-11-18 15:17:06酉鸡
日期:2013-12-06 17:07:16天蝎座
日期:2014-06-11 12:37:07
16 [报告]
发表于 2013-08-07 08:10 |只看该作者
回复 14# 兰花仙子


    {:3_186:}   难道有比这个更好的算法?。。主要超出容量会出错。。- - #

论坛徽章:
42
19周年集字徽章-周
日期:2019-10-14 14:35:31平安夜徽章
日期:2015-12-26 00:06:30数据库技术版块每日发帖之星
日期:2015-12-01 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43IT运维版块每日发帖之星
日期:2015-08-17 06:20:00寅虎
日期:2014-06-04 16:25:27狮子座
日期:2014-05-12 11:00:00辰龙
日期:2013-12-20 17:07:19射手座
日期:2013-10-24 21:01:23CU十二周年纪念徽章
日期:2013-10-24 15:41:34IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
17 [报告]
发表于 2013-08-09 13:30 |只看该作者
本帖最后由 laputa73 于 2013-09-29 11:41 编辑

不能设一个很大的capacity? 1M,10M,100M? 一个网页的链接数总是有限的。
或者,可以监控key_count ,接近capacity就动态再创建一个新filter. 每次多检查一个filter。。。
或者,按26个字母,建26个filter  (感觉没必要,不如一开始直接加大26倍)
总是有办法的。

论坛徽章:
3
未羊
日期:2013-11-18 15:17:06酉鸡
日期:2013-12-06 17:07:16天蝎座
日期:2014-06-11 12:37:07
18 [报告]
发表于 2013-09-29 10:37 |只看该作者
回复 17# laputa73


    突然发现你这个回复,非常接近我的需求。

    但是怎么实现还是个问题。

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
19 [报告]
发表于 2013-09-30 16:33 |只看该作者
好强大!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP