免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: lxyscls
打印 上一主题 下一主题

[算法] 请问平衡搜索树,在哈希之外能够存在原因是不是”有序“? [复制链接]

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
11 [报告]
发表于 2014-05-16 10:43 |只看该作者
本帖最后由 cjaizss 于 2014-05-16 10:44 编辑

hash为非通用算法
而平衡树为通用算法
另外,在极致的情况下,hash的搜索复杂度为线性

论坛徽章:
14
水瓶座
日期:2014-06-10 09:51:0215-16赛季CBA联赛之江苏
日期:2017-11-27 11:42:3515-16赛季CBA联赛之八一
日期:2017-04-12 14:26:2815-16赛季CBA联赛之吉林
日期:2016-08-20 10:43:1215-16赛季CBA联赛之广夏
日期:2016-06-23 09:53:58程序设计版块每日发帖之星
日期:2016-02-11 06:20:00程序设计版块每日发帖之星
日期:2016-02-09 06:20:0015-16赛季CBA联赛之上海
日期:2015-12-25 16:40:3515-16赛季CBA联赛之广夏
日期:2015-12-22 09:39:36程序设计版块每日发帖之星
日期:2015-08-24 06:20:002015亚冠之德黑兰石油
日期:2015-08-07 09:57:302015年辞旧岁徽章
日期:2015-03-03 16:54:15
12 [报告]
发表于 2014-05-16 10:55 |只看该作者
cjaizss 发表于 2014-05-16 10:43
hash为非通用算法
而平衡树为通用算法
另外,在极致的情况下,hash的搜索复杂度为线性


请问这个地方“通用”和“非通用”是怎么定义的?

是不是讲平衡树的算法是“基本”固定的,而哈希为“非”固定,哈希函数需要选择?

论坛徽章:
15
射手座
日期:2014-11-29 19:22:4915-16赛季CBA联赛之青岛
日期:2017-11-17 13:20:09黑曼巴
日期:2017-07-13 19:13:4715-16赛季CBA联赛之四川
日期:2017-02-07 21:08:572015年亚冠纪念徽章
日期:2015-11-06 12:31:58每日论坛发贴之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-07-12 22:20:002015亚冠之浦和红钻
日期:2015-07-08 10:10:132015亚冠之大阪钢巴
日期:2015-06-29 11:21:122015亚冠之广州恒大
日期:2015-05-22 21:55:412015年亚洲杯之伊朗
日期:2015-04-10 16:28:25
13 [报告]
发表于 2014-05-16 10:56 |只看该作者
本帖最后由 yulihua49 于 2014-05-16 11:06 编辑
lxyscls 发表于 2014-05-15 17:52
哈希的插入、删除、查找都足够得好了,空间上的占用也不见得就比平衡树多

请问除了”有序“这个因素外, ...

可以这么说。
我们有时需要比较>,>=,<,<=,这时hash就不灵了,必须平衡树。
看我们tree.h的一部分:
  1. //返回=key的节点
  2. T_Tree * BB_Tree_Find(T_Tree *sp,void *content_key,int len,
  3.         int (*Cmp_rec)(void *sp_content,void *content_key,int len));
  4. //返回>key的节点
  5. T_Tree * BB_Tree_GT(T_Tree *sp,void *content_key,int len,
  6.         int (*Cmp_rec)(void *s1,void *s2,int len));
  7. //返回>=key的节点
  8. T_Tree * BB_Tree_GTEQ(T_Tree *sp,void *content_key,int len,
  9.         int (*Cmp_rec)(void *s1,void *s2,int len));
  10. //返回<key的节点
  11. T_Tree * BB_Tree_LT(T_Tree *sp,void *content_key,int len,
  12.         int (*Cmp_rec)(void *s1,void *s2,int len));
  13. //返回<=key的节点
  14. T_Tree * BB_Tree_LTEQ(T_Tree *sp,void *content_key,int len,
  15.         int (*Cmp_rec)(void *s1,void *s2,int len));
  16. T_Tree * BB_Tree_Del(T_Tree *tp,void *content_key,int size_key,
  17.             int (*Comp)(void *node,void *content,int size_content),
  18.             int (*user_free)(void *content),int *flg);
  19. T_Tree * BB_Tree_MAX(T_Tree *sp);
  20. T_Tree * BB_Tree_MIN(T_Tree *sp);

复制代码
是我们内存数据库工具的一部分,hash怎么玩?
还有hash表动态插、删节点,导致性能劣化。

楼主大有“既生瑜何生亮”的感慨。事实上,瑜和亮都是需要的,各有各的用处。

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
14 [报告]
发表于 2014-05-16 11:08 |只看该作者
lxyscls 发表于 2014-05-16 10:55
请问这个地方“通用”和“非通用”是怎么定义的?

是不是讲平衡树的算法是“基本”固定的,而哈希为 ...
\
恩,可以这么说.

论坛徽章:
59
2015年亚洲杯之约旦
日期:2015-01-27 21:27:392015年亚洲杯之日本
日期:2015-02-06 22:09:41拜羊年徽章
日期:2015-03-03 16:15:432015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015元宵节徽章
日期:2015-03-06 15:50:392015年亚洲杯之阿联酋
日期:2015-03-19 17:39:302015年亚洲杯之中国
日期:2015-03-23 18:52:23巳蛇
日期:2014-12-14 22:44:03双子座
日期:2014-12-10 21:39:16处女座
日期:2014-12-02 08:03:17天蝎座
日期:2014-07-21 19:08:47
15 [报告]
发表于 2014-05-16 11:13 |只看该作者
回复 5# windoze


    用树是基本, HASH最多只能是辅助。
大数据下:
树的复杂度: O (log(n))
HASH无论HASH函数如何选, 是 O (n)。
当然,小数据下, HASH要以做到 o(1).

选择一个通用的HASH函数是不可能的。

论坛徽章:
44
15-16赛季CBA联赛之浙江
日期:2021-10-11 02:03:59程序设计版块每日发帖之星
日期:2016-07-02 06:20:0015-16赛季CBA联赛之新疆
日期:2016-04-25 10:55:452016科比退役纪念章
日期:2016-04-23 00:51:2315-16赛季CBA联赛之山东
日期:2016-04-17 12:00:2815-16赛季CBA联赛之福建
日期:2016-04-12 15:21:2915-16赛季CBA联赛之辽宁
日期:2016-03-24 21:38:2715-16赛季CBA联赛之福建
日期:2016-03-18 12:13:4015-16赛季CBA联赛之佛山
日期:2016-02-05 00:55:2015-16赛季CBA联赛之佛山
日期:2016-02-04 21:11:3615-16赛季CBA联赛之天津
日期:2016-11-02 00:33:1215-16赛季CBA联赛之浙江
日期:2017-01-13 01:31:49
16 [报告]
发表于 2014-05-16 11:13 |只看该作者
回复 14# cjaizss

其实也不一定啊,平衡树要求元素必须能定义全序关系,hash反倒没这个要求,理论上说任何一个函数都可以拿来做hash function,无非是性能差点。

论坛徽章:
44
15-16赛季CBA联赛之浙江
日期:2021-10-11 02:03:59程序设计版块每日发帖之星
日期:2016-07-02 06:20:0015-16赛季CBA联赛之新疆
日期:2016-04-25 10:55:452016科比退役纪念章
日期:2016-04-23 00:51:2315-16赛季CBA联赛之山东
日期:2016-04-17 12:00:2815-16赛季CBA联赛之福建
日期:2016-04-12 15:21:2915-16赛季CBA联赛之辽宁
日期:2016-03-24 21:38:2715-16赛季CBA联赛之福建
日期:2016-03-18 12:13:4015-16赛季CBA联赛之佛山
日期:2016-02-05 00:55:2015-16赛季CBA联赛之佛山
日期:2016-02-04 21:11:3615-16赛季CBA联赛之天津
日期:2016-11-02 00:33:1215-16赛季CBA联赛之浙江
日期:2017-01-13 01:31:49
17 [报告]
发表于 2014-05-16 11:16 |只看该作者
回复 15# folklore

hash是O(n)怎么讲?

论坛徽章:
14
水瓶座
日期:2014-06-10 09:51:0215-16赛季CBA联赛之江苏
日期:2017-11-27 11:42:3515-16赛季CBA联赛之八一
日期:2017-04-12 14:26:2815-16赛季CBA联赛之吉林
日期:2016-08-20 10:43:1215-16赛季CBA联赛之广夏
日期:2016-06-23 09:53:58程序设计版块每日发帖之星
日期:2016-02-11 06:20:00程序设计版块每日发帖之星
日期:2016-02-09 06:20:0015-16赛季CBA联赛之上海
日期:2015-12-25 16:40:3515-16赛季CBA联赛之广夏
日期:2015-12-22 09:39:36程序设计版块每日发帖之星
日期:2015-08-24 06:20:002015亚冠之德黑兰石油
日期:2015-08-07 09:57:302015年辞旧岁徽章
日期:2015-03-03 16:54:15
18 [报告]
发表于 2014-05-16 11:22 |只看该作者
回复 13# yulihua49

还有hash表动态插、删节点,导致性能劣化

请问这个怎么解释?

针对最常用的链表哈希,如果输入键值为随机的,那么无论怎么插入、删除,应该都是均匀的分布在每一个桶里面吧

为什么会劣化?

   

论坛徽章:
15
射手座
日期:2014-11-29 19:22:4915-16赛季CBA联赛之青岛
日期:2017-11-17 13:20:09黑曼巴
日期:2017-07-13 19:13:4715-16赛季CBA联赛之四川
日期:2017-02-07 21:08:572015年亚冠纪念徽章
日期:2015-11-06 12:31:58每日论坛发贴之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-07-12 22:20:002015亚冠之浦和红钻
日期:2015-07-08 10:10:132015亚冠之大阪钢巴
日期:2015-06-29 11:21:122015亚冠之广州恒大
日期:2015-05-22 21:55:412015年亚洲杯之伊朗
日期:2015-04-10 16:28:25
19 [报告]
发表于 2014-05-16 11:23 |只看该作者
folklore 发表于 2014-05-16 11:13
回复 5# windoze

多大数据量叫“大”
我们在百万级的数据里使用hash,静态hash。
依然是O(1),关键是hash算法。

论坛徽章:
14
水瓶座
日期:2014-06-10 09:51:0215-16赛季CBA联赛之江苏
日期:2017-11-27 11:42:3515-16赛季CBA联赛之八一
日期:2017-04-12 14:26:2815-16赛季CBA联赛之吉林
日期:2016-08-20 10:43:1215-16赛季CBA联赛之广夏
日期:2016-06-23 09:53:58程序设计版块每日发帖之星
日期:2016-02-11 06:20:00程序设计版块每日发帖之星
日期:2016-02-09 06:20:0015-16赛季CBA联赛之上海
日期:2015-12-25 16:40:3515-16赛季CBA联赛之广夏
日期:2015-12-22 09:39:36程序设计版块每日发帖之星
日期:2015-08-24 06:20:002015亚冠之德黑兰石油
日期:2015-08-07 09:57:302015年辞旧岁徽章
日期:2015-03-03 16:54:15
20 [报告]
发表于 2014-05-16 11:26 |只看该作者
folklore 发表于 2014-05-16 11:13
回复 5# windoze


链表哈希的插入是O(1)
删除和查找是O(1+a) a:装载因子

您的O(n)是针对哪种哈希而言的?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP