免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: fender0107401
打印 上一主题 下一主题

[算法] 有什么算法可以很快地取到交集。 [复制链接]

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
41 [报告]
发表于 2013-04-01 22:15 |只看该作者
总结一下:

1, 2个数组都排序, 然后求merge.
2, 对数组1建哈希表, 遍历数组2查哈希表.

第二种方法冲突随着规模增大迅速升高, 不过如果支持rehash的哈希表可能会强点.

论坛徽章:
59
2015年亚洲杯之约旦
日期:2015-01-27 21:27:392015年亚洲杯之日本
日期:2015-02-06 22:09:41拜羊年徽章
日期:2015-03-03 16:15:432015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015元宵节徽章
日期:2015-03-06 15:50:392015年亚洲杯之阿联酋
日期:2015-03-19 17:39:302015年亚洲杯之中国
日期:2015-03-23 18:52:23巳蛇
日期:2014-12-14 22:44:03双子座
日期:2014-12-10 21:39:16处女座
日期:2014-12-02 08:03:17天蝎座
日期:2014-07-21 19:08:47
42 [报告]
发表于 2013-04-01 23:05 |只看该作者
回复 41# linux_c_py_php


    支持不支持rehash对本题无影响的
个人支持Hash为比较好的方案。 因为Hash就算只利用了1%的Key空间, 在大规模下也只是匹配100次而已, 这个数目不算大。
当然,前提是Key空间要能自适应目标的规模的大小 。

论坛徽章:
5
狮子座
日期:2013-08-20 10:12:24午马
日期:2013-11-23 18:04:102015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之德黑兰石油
日期:2015-06-29 18:11:1115-16赛季CBA联赛之新疆
日期:2024-02-21 10:00:53
43 [报告]
发表于 2013-04-02 03:31 |只看该作者
judy array?

论坛徽章:
89
水瓶座
日期:2014-04-01 08:53:31天蝎座
日期:2014-04-01 08:53:53天秤座
日期:2014-04-01 08:54:02射手座
日期:2014-04-01 08:54:15子鼠
日期:2014-04-01 08:55:35辰龙
日期:2014-04-01 08:56:36未羊
日期:2014-04-01 08:56:27戌狗
日期:2014-04-01 08:56:13亥猪
日期:2014-04-01 08:56:02亥猪
日期:2014-04-08 08:38:58程序设计版块每日发帖之星
日期:2016-01-05 06:20:00程序设计版块每日发帖之星
日期:2016-01-07 06:20:00
44 [报告]
发表于 2013-04-02 07:50 |只看该作者
不是2个数组是M个数组。 :wink:

论坛徽章:
89
水瓶座
日期:2014-04-01 08:53:31天蝎座
日期:2014-04-01 08:53:53天秤座
日期:2014-04-01 08:54:02射手座
日期:2014-04-01 08:54:15子鼠
日期:2014-04-01 08:55:35辰龙
日期:2014-04-01 08:56:36未羊
日期:2014-04-01 08:56:27戌狗
日期:2014-04-01 08:56:13亥猪
日期:2014-04-01 08:56:02亥猪
日期:2014-04-08 08:38:58程序设计版块每日发帖之星
日期:2016-01-05 06:20:00程序设计版块每日发帖之星
日期:2016-01-07 06:20:00
45 [报告]
发表于 2013-04-02 07:52 |只看该作者
__BlueGuy__ 发表于 2013-04-01 21:51
你找个O(1)不快的例子我看看


你要是保证以后在CU上不骂人,我就给你举个例子出来。

论坛徽章:
0
46 [报告]
发表于 2013-04-02 10:31 |只看该作者
回复 1# fender0107401

为啥不使用位数组呢,假设你有100万个数,定义一个100万位数组也才需要空间123KB,位数组初始化为0.
然后遍历第一个数组,将对应的元素位置1,然后遍历第二个数组,查看对应的位是否为1即可。

复杂度就是M + N。


   

论坛徽章:
0
47 [报告]
发表于 2013-04-02 10:36 |只看该作者
回复 46# insnowind

上面是两个数组的情况,N个数组也是一样,把前两个交集的结果作为一个数组,与后面的持续遍历即可;


   

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
48 [报告]
发表于 2013-04-02 10:55 |只看该作者
位图是高效, 面试经常问.

论坛徽章:
36
子鼠
日期:2013-08-28 22:23:29黄金圣斗士
日期:2015-12-01 11:37:51程序设计版块每日发帖之星
日期:2015-12-14 06:20:00CU十四周年纪念徽章
日期:2015-12-22 16:50:40IT运维版块每日发帖之星
日期:2016-01-25 06:20:0015-16赛季CBA联赛之深圳
日期:2016-01-27 10:31:172016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之福建
日期:2016-04-07 11:25:2215-16赛季CBA联赛之青岛
日期:2016-04-29 18:02:5915-16赛季CBA联赛之北控
日期:2016-06-20 17:38:50技术图书徽章
日期:2016-07-19 13:54:03程序设计版块每日发帖之星
日期:2016-08-21 06:20:00
49 [报告]
发表于 2013-04-02 11:07 |只看该作者
回复 46# insnowind


    如果数组里最大的数字式1 0000 0000呢

论坛徽章:
8
CU大牛徽章
日期:2013-04-17 10:59:39CU大牛徽章
日期:2013-04-17 11:01:45CU大牛徽章
日期:2013-04-17 11:02:15CU大牛徽章
日期:2013-04-17 11:02:36CU大牛徽章
日期:2013-04-17 11:02:58技术图书徽章
日期:2013-12-04 10:48:50酉鸡
日期:2014-01-03 10:32:30辰龙
日期:2014-03-06 15:04:07
50 [报告]
发表于 2013-04-02 11:29 |只看该作者
本帖最后由 shan_ghost 于 2013-04-02 11:33 编辑
cokeboL 发表于 2013-04-02 11:07


+1024

32位机器上,max_int=2,147,483,647
比你这个数字狠太多了……


PS:位图的确高效。但能用位图的前提是:目标数字本身取值范围较窄。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP