免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1800 | 回复: 5
打印 上一主题 下一主题

1000个模式串 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-12-21 14:38 |只看该作者 |倒序浏览
现在有个任务,有一段文字,有1000个模式串
要看看有哪些模式串在这段文字中有匹配
请问这个应该如何去做
想过用或的方法
有没有其他方法呢?

论坛徽章:
0
2 [报告]
发表于 2009-12-21 14:40 |只看该作者

回复 #1 xiangyu1986 的帖子

一个一个去比较的方法就不说了
这个效率就比较低了
想把这1000个模式串合成一个大的状态机
又能报告出是哪些模式串匹配上了

论坛徽章:
0
3 [报告]
发表于 2009-12-21 20:29 |只看该作者
如果 1000 个regex的话,我想每个regex 应该比较简单吧?这样的话,建议反过来,将要匹配的字串,翻译为模式,然后到 1000 个模式的  hash 去匹配,当然要看你具体的数据是什么样子了,反正只要是从多个匹配单个的话,性能优先,hash table是第一选择吧~

论坛徽章:
0
4 [报告]
发表于 2009-12-22 15:32 |只看该作者

回复 #2 xiangyu1986 的帖子

你说的状态机是对的~
Mastering RE书里有讲~~

论坛徽章:
1
狮子座
日期:2013-12-16 16:09:24
5 [报告]
发表于 2009-12-22 15:35 |只看该作者
原帖由 兰花仙子 于 2009-12-22 15:32 发表
你说的状态机是对的~
Mastering RE书里有讲~~


你说的是不是猫头鹰书?

论坛徽章:
0
6 [报告]
发表于 2009-12-22 15:44 |只看该作者

回复 #5 ttcn_cu 的帖子

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP