免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 8794 | 回复: 3
打印 上一主题 下一主题

linux hash表的桶数量的确定 [复制链接]

论坛徽章:
0
1 [报告]
发表于 2009-07-21 12:39 |显示全部楼层
一般情况下都是自己根据数据特性来考虑使用的 hash 算法,不是千篇一律咬死一个不放
比如存放 IP 地址的 hash table,用一个 65536 的桶就很好,把 IP 的后 16bit 作为 key
这种方法绝对比 hash_long、jhash 等函数的碰撞率低

论坛徽章:
0
2 [报告]
发表于 2009-07-21 16:25 |显示全部楼层
原帖由 xiegang112 于 2009-7-21 13:15 发表
有道理,我教条了。 不过,你说的这个情况是在n一定得时候。我的情况n的范围并不太固定。

也不是啊,加入有一个收集 IP 的 hash table,那么 IP 数有可能到多少我也不清楚
为什么说适用于 n 一定的时候呢?

论坛徽章:
0
3 [报告]
发表于 2009-07-21 17:23 |显示全部楼层
原帖由 Godbach 于 2009-7-21 17:01 发表


我觉得LZ的意思是不是至少这个IP的集合是确定的,顶多2^32个IP地址。

如果这样的话,那尽量考虑得大一些吧
其实几乎没有不能确定总数量的情况,什么都有个 “界”,真的无限的话,存储空间也不够啊
比如 conntrack,人为是限制有 max 的

论坛徽章:
0
4 [报告]
发表于 2009-07-21 19:14 |显示全部楼层
原帖由 xiegang112 于 2009-7-21 18:54 发表
而且个人觉得,hash比其他搜索的数据结构灵活的地方就是它的可定制性。可以根据具体情况调整,以达到最优的效果。

说得没错,其实可以根据实际情况动态调整 bucket 大小,实现空间/效率的最好结合点
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP