免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: flw2
打印 上一主题 下一主题

10万个字符串,检查相同的.怎么找? [复制链接]

论坛徽章:
0
21 [报告]
发表于 2006-09-25 10:55 |只看该作者
原帖由 unix_os 于 2006-9-25 10:43 发表



8懂这个木有关系。。。

有排序树。。。

刚刚在googleBLOG里看到的
http://googlechinablog.com/2006/08/blog-post.html

论坛徽章:
0
22 [报告]
发表于 2006-10-20 14:47 |只看该作者
我发表了一个类似的主题,结果被锁贴,在回复中给了这个贴子的网址,结果还是没有解决问题,
有谁可以给出代码来解决这个问题啊
我在写代码时被卡住了,请指教

论坛徽章:
0
23 [报告]
发表于 2006-10-20 14:56 |只看该作者
原帖由 wxhltmn 于 2006-10-20 14:47 发表
我发表了一个类似的主题,结果被锁贴,在回复中给了这个贴子的网址,结果还是没有解决问题,
有谁可以给出代码来解决这个问题啊
我在写代码时被卡住了,请指教


我贴代码了啊!

论坛徽章:
0
24 [报告]
发表于 2006-10-20 15:54 |只看该作者
对你的代码我看了,但是水平不够啊,将你的代码导入后就是无法运行,
对其中的变量和函数找不到头绪啊,能不能给一个完整点的呢,谢谢

论坛徽章:
0
25 [报告]
发表于 2006-10-20 16:30 |只看该作者
原帖由 wxhltmn 于 2006-10-20 15:54 发表
对你的代码我看了,但是水平不够啊,将你的代码导入后就是无法运行,
对其中的变量和函数找不到头绪啊,能不能给一个完整点的呢,谢谢


其实就是Trie树,空间换时间。完整的代码在家里,晚上再说。

论坛徽章:
0
26 [报告]
发表于 2006-10-20 18:00 |只看该作者
10W个串,如果短,得老多重复的了吧?信息熵编码啊,找个压缩算法就有思路了~trie不失为好办法。
重复少的话,觉的HASH比较好。MD4就行啦,快不少呢~

论坛徽章:
0
27 [报告]
发表于 2006-10-21 06:54 |只看该作者
尽管可以拿出许多种解法,包括未来世界的MD10000,但是,切合实际的、高效的,还是楼主自己说的:先排序。

论坛徽章:
0
28 [报告]
发表于 2006-10-21 08:16 |只看该作者
10万个字符串,检查相同的.怎么找?

看楼主的题意,应该是按模式串找出指定的串共有多少吧?其实,如果不是为了实验新的算法,大可不必用hash之类,直接调用串比较函数不就完了么?

使用字符串比较用“strcmp()”,使用二进制串比较用“bcmp()”。具体使用看手册页。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP