免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: lxyscls
打印 上一主题 下一主题

[算法] 请问平衡搜索树,在哈希之外能够存在原因是不是”有序“? [复制链接]

论坛徽章:
15
射手座
日期:2014-11-29 19:22:4915-16赛季CBA联赛之青岛
日期:2017-11-17 13:20:09黑曼巴
日期:2017-07-13 19:13:4715-16赛季CBA联赛之四川
日期:2017-02-07 21:08:572015年亚冠纪念徽章
日期:2015-11-06 12:31:58每日论坛发贴之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-07-12 22:20:002015亚冠之浦和红钻
日期:2015-07-08 10:10:132015亚冠之大阪钢巴
日期:2015-06-29 11:21:122015亚冠之广州恒大
日期:2015-05-22 21:55:412015年亚洲杯之伊朗
日期:2015-04-10 16:28:25
21 [报告]
发表于 2014-05-16 11:28 |只看该作者
lxyscls 发表于 2014-05-16 11:22
回复 13# yulihua49

还有hash表动态插、删节点,导致性能劣化

那要看你的具体算法的安排和实际的数据,你无法保证不劣化,好的话可能会劣化的慢一些。

论坛徽章:
14
水瓶座
日期:2014-06-10 09:51:0215-16赛季CBA联赛之江苏
日期:2017-11-27 11:42:3515-16赛季CBA联赛之八一
日期:2017-04-12 14:26:2815-16赛季CBA联赛之吉林
日期:2016-08-20 10:43:1215-16赛季CBA联赛之广夏
日期:2016-06-23 09:53:58程序设计版块每日发帖之星
日期:2016-02-11 06:20:00程序设计版块每日发帖之星
日期:2016-02-09 06:20:0015-16赛季CBA联赛之上海
日期:2015-12-25 16:40:3515-16赛季CBA联赛之广夏
日期:2015-12-22 09:39:36程序设计版块每日发帖之星
日期:2015-08-24 06:20:002015亚冠之德黑兰石油
日期:2015-08-07 09:57:302015年辞旧岁徽章
日期:2015-03-03 16:54:15
22 [报告]
发表于 2014-05-16 11:29 |只看该作者
回复 19# yulihua49

请问您这里讲的静态HASH是不是指针对一个静态集合(数据个数固定,只支持查找,譬如说一般的字典?)

使用完美哈希的方式


   

论坛徽章:
14
水瓶座
日期:2014-06-10 09:51:0215-16赛季CBA联赛之江苏
日期:2017-11-27 11:42:3515-16赛季CBA联赛之八一
日期:2017-04-12 14:26:2815-16赛季CBA联赛之吉林
日期:2016-08-20 10:43:1215-16赛季CBA联赛之广夏
日期:2016-06-23 09:53:58程序设计版块每日发帖之星
日期:2016-02-11 06:20:00程序设计版块每日发帖之星
日期:2016-02-09 06:20:0015-16赛季CBA联赛之上海
日期:2015-12-25 16:40:3515-16赛季CBA联赛之广夏
日期:2015-12-22 09:39:36程序设计版块每日发帖之星
日期:2015-08-24 06:20:002015亚冠之德黑兰石油
日期:2015-08-07 09:57:302015年辞旧岁徽章
日期:2015-03-03 16:54:15
23 [报告]
发表于 2014-05-16 11:32 |只看该作者
回复 21# yulihua49

谢谢,大概明白一些了

暂时抛开哈希函数的选择问题,只谈数据

实际应用中的数据无法保证数学上面的真正均匀分布,因此哈希无法保证不劣化?是不是可以这么理解部分?

   

论坛徽章:
15
射手座
日期:2014-11-29 19:22:4915-16赛季CBA联赛之青岛
日期:2017-11-17 13:20:09黑曼巴
日期:2017-07-13 19:13:4715-16赛季CBA联赛之四川
日期:2017-02-07 21:08:572015年亚冠纪念徽章
日期:2015-11-06 12:31:58每日论坛发贴之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-07-12 22:20:002015亚冠之浦和红钻
日期:2015-07-08 10:10:132015亚冠之大阪钢巴
日期:2015-06-29 11:21:122015亚冠之广州恒大
日期:2015-05-22 21:55:412015年亚洲杯之伊朗
日期:2015-04-10 16:28:25
24 [报告]
发表于 2014-05-16 11:48 |只看该作者
本帖最后由 yulihua49 于 2014-05-16 11:51 编辑
lxyscls 发表于 2014-05-16 11:29
回复 19# yulihua49

请问您这里讲的静态HASH是不是指针对一个静态集合(数据个数固定,只支持查找,譬如 ...

是这样的。容易设计出最小冲突键。

有意思的是,无论如何选择,冲突率总是在1/3左右,二次冲突占一次冲突的1/3,......很奇怪。

论坛徽章:
15
射手座
日期:2014-11-29 19:22:4915-16赛季CBA联赛之青岛
日期:2017-11-17 13:20:09黑曼巴
日期:2017-07-13 19:13:4715-16赛季CBA联赛之四川
日期:2017-02-07 21:08:572015年亚冠纪念徽章
日期:2015-11-06 12:31:58每日论坛发贴之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-07-12 22:20:002015亚冠之浦和红钻
日期:2015-07-08 10:10:132015亚冠之大阪钢巴
日期:2015-06-29 11:21:122015亚冠之广州恒大
日期:2015-05-22 21:55:412015年亚洲杯之伊朗
日期:2015-04-10 16:28:25
25 [报告]
发表于 2014-05-16 11:55 |只看该作者
lxyscls 发表于 2014-05-16 11:32
回复 21# yulihua49

谢谢,大概明白一些了

我感觉应该是的。
而平衡树永远不会劣化。
所以数据库通常使用B+树而较少使用hash。

论坛徽章:
59
2015年亚洲杯之约旦
日期:2015-01-27 21:27:392015年亚洲杯之日本
日期:2015-02-06 22:09:41拜羊年徽章
日期:2015-03-03 16:15:432015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015元宵节徽章
日期:2015-03-06 15:50:392015年亚洲杯之阿联酋
日期:2015-03-19 17:39:302015年亚洲杯之中国
日期:2015-03-23 18:52:23巳蛇
日期:2014-12-14 22:44:03双子座
日期:2014-12-10 21:39:16处女座
日期:2014-12-02 08:03:17天蝎座
日期:2014-07-21 19:08:47
26 [报告]
发表于 2014-05-16 12:18 |只看该作者
回复 19# yulihua49


    所谓O (X) 是指动态增长时的函数关系
也就是当 数据量是1(好吧,你这里的1是百万)时复杂度是1,
数据量为n时, 复杂度是多少, 对树来说, Log(n)是没有疑问的,
这也是我见过的在现在数学上能做到的最好的查找复杂度。
百万是 O(1), 那百万的百万呢?

HASH表,无论你做几层HASH,
HASH的表项有几个(如比一亿个),
随着数据量的增加, 它的复杂度将变成 O(n),
因为平均每个表项上冲突的数据将是: n/表项数。 而表项数无论如何都是常数
(就算它能自动增长,对数据量来说, 它也是低价函数或者常数,
因为HASH表本来就是基于这个原理的, 不然HASH表就被"优化"成线性表了。
对于查找算法来说, o(n)是数学上最高的复杂度
它和线性查找的复杂度一样:也就是说使用HASH表不会降低复杂度。

论坛徽章:
59
2015年亚洲杯之约旦
日期:2015-01-27 21:27:392015年亚洲杯之日本
日期:2015-02-06 22:09:41拜羊年徽章
日期:2015-03-03 16:15:432015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015元宵节徽章
日期:2015-03-06 15:50:392015年亚洲杯之阿联酋
日期:2015-03-19 17:39:302015年亚洲杯之中国
日期:2015-03-23 18:52:23巳蛇
日期:2014-12-14 22:44:03双子座
日期:2014-12-10 21:39:16处女座
日期:2014-12-02 08:03:17天蝎座
日期:2014-07-21 19:08:47
27 [报告]
发表于 2014-05-16 12:20 |只看该作者
回复 20# lxyscls


    你的复杂度算法比较先进~~

论坛徽章:
59
2015年亚洲杯之约旦
日期:2015-01-27 21:27:392015年亚洲杯之日本
日期:2015-02-06 22:09:41拜羊年徽章
日期:2015-03-03 16:15:432015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015元宵节徽章
日期:2015-03-06 15:50:392015年亚洲杯之阿联酋
日期:2015-03-19 17:39:302015年亚洲杯之中国
日期:2015-03-23 18:52:23巳蛇
日期:2014-12-14 22:44:03双子座
日期:2014-12-10 21:39:16处女座
日期:2014-12-02 08:03:17天蝎座
日期:2014-07-21 19:08:47
28 [报告]
发表于 2014-05-16 12:25 |只看该作者
回复 17# windoze


    因为无论HASH表项有多大, 但总是一个常数a。
这样,最终在大数据量的情况下, 复杂度是 n/a ,也就是 o(n).
一次HASH是这样, n 次HASH的复杂度是
o(n)/(1的n次方), 还是o(n).
也就是说HASH不会减小算法的时间复杂度。
它只是表项相对多, 数据量相对小的情况下改善时间性能一种“技巧”。

论坛徽章:
15
射手座
日期:2014-11-29 19:22:4915-16赛季CBA联赛之青岛
日期:2017-11-17 13:20:09黑曼巴
日期:2017-07-13 19:13:4715-16赛季CBA联赛之四川
日期:2017-02-07 21:08:572015年亚冠纪念徽章
日期:2015-11-06 12:31:58每日论坛发贴之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-08-04 06:20:00程序设计版块每日发帖之星
日期:2015-07-12 22:20:002015亚冠之浦和红钻
日期:2015-07-08 10:10:132015亚冠之大阪钢巴
日期:2015-06-29 11:21:122015亚冠之广州恒大
日期:2015-05-22 21:55:412015年亚洲杯之伊朗
日期:2015-04-10 16:28:25
29 [报告]
发表于 2014-05-16 12:28 |只看该作者
本帖最后由 yulihua49 于 2014-05-16 12:33 编辑

回复 26# folklore
补充一点,O(1)就是与数据量无关,静态hash,不管数据量多大,都能做到O(1)。当然要选取良好的hash函数。(f(key)%n)
动态的,劣化以后就不好说了,可能会 O(n)吧。


   

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
30 [报告]
发表于 2014-05-16 12:36 |只看该作者
folklore 发表于 2014-05-16 11:13
回复 5# windoze

这里的O(n)前面最好加个“伪”字
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP