免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Linux环境编程 › 讨论一个高性能的查找方法

1 23 / 3 页

最近访问板块

发新帖

楼主: duanjigang

上一主题

下一主题

讨论一个高性能的查找方法 [复制链接]

论坛徽章:: 0

21楼 [报告]

发表于 2010-11-12 14:50 |只看该作者

寻找到高效方法了，测试中，没问题后，我发上来

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 3

金牛座
日期:2014-06-14 22:04:06

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015年迎新春徽章
日期:2015-03-04 09:49:45

22楼 [报告]

发表于 2010-11-12 15:37 |只看该作者

回复 21# duanjigang

赶紧发，速度点

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

23楼 [报告]

发表于 2010-11-13 11:14 |只看该作者

问题已经解决了，同事找他算法的同学问的，给出了个点子，不错！
原来的做法是用 srcaddr | dstaddr | (srcport << 16)|dstport做哈希key值。
但是这个方法受数据影响很大，300万个节点要完全统计起来太慢了，有时完全会阻塞住。一分钟根本不够。
新的方法是:
每个缓冲区放300万个节点，然后五个缓冲区连接成一个环形链表，读线程同样遍历链表，讲从内存中读出的数据写入到缓冲区中，待缓冲区满了，然后进入下一个节点的填充，或者等待空闲缓冲区。
而处理线程，也是遍历链表，找到一个填满的缓冲区后，首先对缓冲区的300万个节点进行排序，使用qsort,排序后，300万个节点其实已经分好组了，相等的都靠在一起。这时，再遍历300万个节点一遍。把相等的节点的value值加起来，就完成合并了。每处理完一组值，就相当于生成了一个要汇报的节点(也就是说这组的节点合并成一个节点进行汇报了)。
这样做效率确实高。从昨天下午测试到现在，大概结果比较稳定，排序300万个5秒钟完成，遍历并且汇报节点，最多10秒左右，最小4,5秒，现在持续4秒钟。
这个结果确实出乎意外啊。很满意。

我会继续跟踪后续的问题，如果有新的进展，继续讨论。

评分

参与人数 1	可用积分 +30	收起理由
dreamice	+ 30	精彩！

查看全部评分

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

24楼 [报告]

发表于 2010-11-13 11:15 |只看该作者

置为精华，多多关注！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

25楼 [报告]

发表于 2010-11-14 21:30 |只看该作者

仰视一下大牛.
学习了!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 5

狮子座
日期:2013-08-20 10:12:24

午马
日期:2013-11-23 18:04:10

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015亚冠之德黑兰石油
日期:2015-06-29 18:11:11

15-16赛季CBA联赛之新疆
日期:2024-02-21 10:00:53

26楼 [报告]

发表于 2010-11-16 00:41 |只看该作者

再试试看 hash 嘛，这个数量级 hash 应该不慢的呀~~~

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 7

丑牛
日期:2013-10-18 14:43:21

技术图书徽章
日期:2013-11-03 09:58:03

辰龙
日期:2014-01-15 22:57:50

午马
日期:2014-09-15 07:04:39

丑牛
日期:2014-10-16 14:25:22

2015年亚洲杯之伊朗
日期:2015-03-16 10:24:35

2015亚冠之城南
日期:2015-05-31 09:52:32

27楼 [报告]

发表于 2010-11-16 01:44 |只看该作者

鄙视一下根本没说清楚什么叫合并...

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

28楼 [报告]

发表于 2010-11-18 15:51 |只看该作者

鄙视一下根本没说清楚什么叫合并...
smalloc 发表于 2010-11-16 01:44

合并这样定义，一个类型的对象，你定义一个相等的函数，如果两个对象相等的话，合并了，就是把他们的数据段相加，相等的部分保留呗。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 3

金牛座
日期:2014-06-14 22:04:06

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015年迎新春徽章
日期:2015-03-04 09:49:45

29楼 [报告]

发表于 2010-11-18 16:04 |只看该作者

回复 27# smalloc

同鄙视

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

1 23 / 3 页

发新帖

Chinaunix › 论坛 › 程序设计 › Linux环境编程 › 讨论一个高性能的查找方法

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP