免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1942 | 回复: 6
打印 上一主题 下一主题

URL查找 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-02-15 20:02 |只看该作者 |倒序浏览
对于URL的存储与查找,网上找了很多资料,要不就是太复杂的场景,要不就没看到(也许关键字有误)。

现在我有这么一种场景,各位做过的请帮忙指点一下:
1. 程序会不定时的插入URL,类似于/app/a/b/c.htm等等,但插入不是有序的,因为路径千奇百怪。如何存储?
2. 程序会指定URL进行查找,看是否有完全匹配的URL被找到。如何查询?

论坛徽章:
0
2 [报告]
发表于 2012-02-16 09:18 |只看该作者
Bloom Filter

论坛徽章:
0
3 [报告]
发表于 2012-02-16 12:03 |只看该作者
Bloom Filter我看了一下,会与误操作。且它是不是太大了。我的URL记录数,在1W以下。

论坛徽章:
0
4 [报告]
发表于 2012-02-16 13:29 |只看该作者
怕碰撞  链表hash加字符串匹配,首次hash后再字符串匹配遍历链表

论坛徽章:
0
5 [报告]
发表于 2012-03-09 11:30 |只看该作者
后来直接用MAP解决的。

论坛徽章:
0
6 [报告]
发表于 2012-03-09 12:39 |只看该作者
我觉得如果你的url是无规律的,还是hash靠谱,或者你做个trie结构?

论坛徽章:
0
7 [报告]
发表于 2012-03-09 13:51 |只看该作者
trie树倒是可以一试
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP