免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: zhujiang73
打印 上一主题 下一主题

[算法] 求个容错匹配算法 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2011-10-21 16:19 |只看该作者
本帖最后由 三月廿七 于 2011-10-21 17:13 编辑
类似这个效果,

      1.**********,本人数学不好大家帮忙,********* ...
zhujiang73 发表于 2011-10-14 10:17


粗略的计算一下,...  

"(两个句子中有80%以上的字相同就算匹配)" 这一步是省不了的,...
0(n)
然后,BST的速度还可以, 如果BST能够适合要求, 还考虑什么rbtree..., 不是多此一举啊,  

你把第一篇文章包含的所有字符串的地址添加到 BST中,然后再用第二篇作对比
(2nlgn)
估计 字符串比较 和 计算字符串相似度 可以合在一个函数里处理

所以, 最终的复杂度就是 2nlgn

论坛徽章:
24
狮子座
日期:2013-12-31 10:48:0015-16赛季CBA联赛之吉林
日期:2016-04-18 14:43:1015-16赛季CBA联赛之北控
日期:2016-05-18 15:01:4415-16赛季CBA联赛之上海
日期:2016-06-22 18:00:1315-16赛季CBA联赛之八一
日期:2016-06-25 11:02:2215-16赛季CBA联赛之佛山
日期:2016-08-17 22:48:2615-16赛季CBA联赛之福建
日期:2016-12-27 22:39:272016科比退役纪念章
日期:2017-02-08 23:49:4315-16赛季CBA联赛之八一
日期:2017-02-16 01:05:3415-16赛季CBA联赛之山东
日期:2017-02-22 15:34:5615-16赛季CBA联赛之上海
日期:2017-11-25 16:17:5015-16赛季CBA联赛之四川
日期:2016-01-17 18:38:37
12 [报告]
发表于 2011-10-21 17:07 |只看该作者
粗略的计算一下,...   

"(两个句子中有80%以上的字相同就算匹配)" 这一步是省不了的,...
...
三月廿七 发表于 2011-10-21 16:19



    “二叉查找树(Binary Search Tree),或者是一棵空树,或者是具有下列性质的二叉树: 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值; 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值”

     按这个算法不容错呀,前面有一个字不对就跑到另一个分支去了。

论坛徽章:
0
13 [报告]
发表于 2011-10-21 17:17 |只看该作者
“二叉查找树(Binary Search Tree),或者是一棵空树,或者是具有下列性质的二叉树: 若它的左子 ...
zhujiang73 发表于 2011-10-21 17:07

{:3_182:}
不如用 字符串哈希吧...

论坛徽章:
24
狮子座
日期:2013-12-31 10:48:0015-16赛季CBA联赛之吉林
日期:2016-04-18 14:43:1015-16赛季CBA联赛之北控
日期:2016-05-18 15:01:4415-16赛季CBA联赛之上海
日期:2016-06-22 18:00:1315-16赛季CBA联赛之八一
日期:2016-06-25 11:02:2215-16赛季CBA联赛之佛山
日期:2016-08-17 22:48:2615-16赛季CBA联赛之福建
日期:2016-12-27 22:39:272016科比退役纪念章
日期:2017-02-08 23:49:4315-16赛季CBA联赛之八一
日期:2017-02-16 01:05:3415-16赛季CBA联赛之山东
日期:2017-02-22 15:34:5615-16赛季CBA联赛之上海
日期:2017-11-25 16:17:5015-16赛季CBA联赛之四川
日期:2016-01-17 18:38:37
14 [报告]
发表于 2011-10-21 17:21 |只看该作者
不如用 字符串哈希吧...
三月廿七 发表于 2011-10-21 17:17



    不是吧,一句里有一个字不同哈希也不同呀?

论坛徽章:
0
15 [报告]
发表于 2011-10-21 17:26 |只看该作者
本帖最后由 三月廿七 于 2011-10-21 17:35 编辑
不是吧,一句里有一个字不同哈希也不同呀?
zhujiang73 发表于 2011-10-21 17:21

那我就只知道 两层 for  循环啦...{:3_183:}

论坛徽章:
24
狮子座
日期:2013-12-31 10:48:0015-16赛季CBA联赛之吉林
日期:2016-04-18 14:43:1015-16赛季CBA联赛之北控
日期:2016-05-18 15:01:4415-16赛季CBA联赛之上海
日期:2016-06-22 18:00:1315-16赛季CBA联赛之八一
日期:2016-06-25 11:02:2215-16赛季CBA联赛之佛山
日期:2016-08-17 22:48:2615-16赛季CBA联赛之福建
日期:2016-12-27 22:39:272016科比退役纪念章
日期:2017-02-08 23:49:4315-16赛季CBA联赛之八一
日期:2017-02-16 01:05:3415-16赛季CBA联赛之山东
日期:2017-02-22 15:34:5615-16赛季CBA联赛之上海
日期:2017-11-25 16:17:5015-16赛季CBA联赛之四川
日期:2016-01-17 18:38:37
16 [报告]
发表于 2011-10-21 17:34 |只看该作者
本来就是两个不同的句子呀, 你不能事先假定他俩相同,
你还得比较啊,不然你比较什么呢??
三月廿七 发表于 2011-10-21 17:26



     需要某种特征值,两个句子里相同的部分越多这个特征值越接近,特征值的差较小时认为这两个句子近似匹配。

论坛徽章:
0
17 [报告]
发表于 2011-10-21 17:36 |只看该作者
本帖最后由 三月廿七 于 2011-10-21 17:40 编辑
需要某种特征值,两个句子里相同的部分越多这个特征值越接近,特征值的差较小时认为这两个句子近 ...
zhujiang73 发表于 2011-10-21 17:34


我知道我说错了, 你还 MARK 一下, 我晕哦
本来想得分的, 结果分没得到, 把脸给丢了 {:3_183:} ....

隐约记得 编程之美中 有一道题是计算字符串相似度的,你可以搜下...

论坛徽章:
0
18 [报告]
发表于 2011-10-21 17:37 |只看该作者
不好办啊,这样算匹配吗?

赵兄托你帮我半点事

事点半我帮你托兄赵

论坛徽章:
24
狮子座
日期:2013-12-31 10:48:0015-16赛季CBA联赛之吉林
日期:2016-04-18 14:43:1015-16赛季CBA联赛之北控
日期:2016-05-18 15:01:4415-16赛季CBA联赛之上海
日期:2016-06-22 18:00:1315-16赛季CBA联赛之八一
日期:2016-06-25 11:02:2215-16赛季CBA联赛之佛山
日期:2016-08-17 22:48:2615-16赛季CBA联赛之福建
日期:2016-12-27 22:39:272016科比退役纪念章
日期:2017-02-08 23:49:4315-16赛季CBA联赛之八一
日期:2017-02-16 01:05:3415-16赛季CBA联赛之山东
日期:2017-02-22 15:34:5615-16赛季CBA联赛之上海
日期:2017-11-25 16:17:5015-16赛季CBA联赛之四川
日期:2016-01-17 18:38:37
19 [报告]
发表于 2011-10-21 17:41 |只看该作者
隐约记得 编程之美中 有一道题是计算字符串相似度的...
三月廿七 发表于 2011-10-21 17:36



    我找找去 {:3_189:}

论坛徽章:
24
狮子座
日期:2013-12-31 10:48:0015-16赛季CBA联赛之吉林
日期:2016-04-18 14:43:1015-16赛季CBA联赛之北控
日期:2016-05-18 15:01:4415-16赛季CBA联赛之上海
日期:2016-06-22 18:00:1315-16赛季CBA联赛之八一
日期:2016-06-25 11:02:2215-16赛季CBA联赛之佛山
日期:2016-08-17 22:48:2615-16赛季CBA联赛之福建
日期:2016-12-27 22:39:272016科比退役纪念章
日期:2017-02-08 23:49:4315-16赛季CBA联赛之八一
日期:2017-02-16 01:05:3415-16赛季CBA联赛之山东
日期:2017-02-22 15:34:5615-16赛季CBA联赛之上海
日期:2017-11-25 16:17:5015-16赛季CBA联赛之四川
日期:2016-01-17 18:38:37
20 [报告]
发表于 2011-10-21 17:43 |只看该作者
不好办啊,这样算匹配吗?

赵兄托你帮我半点事

事点半我帮你托兄赵
AD8018 发表于 2011-10-21 17:37



    这个应该是不行的
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP