免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 10032 | 回复: 5
打印 上一主题 下一主题

[文本处理] 求优化正则表达式,精确以逗号为分隔的匹配字符串 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-01-15 14:41 |只看该作者 |倒序浏览
本帖最后由 iuingeng 于 2013-01-15 14:43 编辑

需求是这样的:
有多行的文本,每行之间没有关系。文本举例如下:
ABC,DDD,BLOOK,HIGH,AB,SIR,SIRRY
AB,SIR,SIRRY
SIR
SIR_dd,DDD,ABC
DDSIR,DDD,ABC

要求精确匹配输入的字符串,例如“SIR”,上例中 第1、2、3行为正确匹配行;
我自己写了个比较笨的实现:  ',SIR$|,SIR,|^SIR,|^SIR$'

求各位帮忙精简优化~~~



论坛徽章:
7
数据库技术版块每日发帖之星
日期:2015-08-08 06:20:00数据库技术版块每日发帖之星
日期:2015-08-29 06:20:00数据库技术版块每日发帖之星
日期:2015-08-29 06:20:00数据库技术版块每日发帖之星
日期:2015-09-18 06:20:00数据库技术版块每周发帖之星
日期:2015-11-06 19:56:51数据库技术版块每日发帖之星
日期:2016-01-22 06:20:00数据库技术版块每日发帖之星
日期:2016-02-05 06:20:00
2 [报告]
发表于 2013-01-15 14:49 |只看该作者
本帖最后由 asdf2110 于 2013-01-15 14:54 编辑

昨天有人问过吧
  1. grep -w "SIR"
  2. grep "\<SIR\>"
  3. grep "\bSIR\b"
复制代码
http://bbs.chinaunix.net/thread-3706141-1-1.html

论坛徽章:
0
3 [报告]
发表于 2013-01-15 14:51 |只看该作者
本帖最后由 hbmhalley 于 2013-01-15 14:52 编辑

^\(.*,\)\?SIR\(,.*\)\?$
\(^\|,\)SIR\(,\|$\)

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
4 [报告]
发表于 2013-01-15 16:30 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
5 [报告]
发表于 2013-01-16 11:39 |只看该作者
回复 2# asdf2110


    换了个方式问了,所以是不一样的问题哦

论坛徽章:
0
6 [报告]
发表于 2013-01-24 10:40 |只看该作者
谢谢各位~~~
忘了说明环境了:是java中的正则表达式~~,,我写成如下格式,解决了问题:
(.*,|^)(SIR)(,.*|$)
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP