免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 10758 | 回复: 13
打印 上一主题 下一主题

[文本处理] 限制字符串中某个字符连续出现的次数,正则表达式应该怎么定义 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-07-15 09:19 |只看该作者 |倒序浏览
假设字符串中字符的取值范围为0到9,我想限制字符串中0连续出现的次数最多为3次。
怎么定义正则表达式啊?
123020003  满足
123000023 不满足

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
2 [报告]
发表于 2013-07-15 09:31 |只看该作者
  1. ([^0]+?)0{1,3}([^0]+?)
复制代码

论坛徽章:
0
3 [报告]
发表于 2013-07-15 09:35 |只看该作者
回复 2# dn833
长度小于3的全为0的片段可以出现多次。。

   

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
4 [报告]
发表于 2013-07-15 09:46 |只看该作者
  1. [root@CentOS6-2 tmp]# cat a
  2. 123020003
  3. 123021203
  4. 123001203
  5. 000300221
  6. 300221000
  7. 123000023
  8. [root@CentOS6-2 tmp]# grep -P '([^0]+?)0{1,3}([^0]+?)' a
  9. 123020003
  10. 123021203
  11. 123001203
  12. 000300221
  13. 300221000
复制代码

论坛徽章:
1
技术图书徽章
日期:2013-08-30 10:47:12
5 [报告]
发表于 2013-07-15 11:14 |只看该作者
grep 'o\{3,3\}' a

论坛徽章:
0
6 [报告]
发表于 2013-07-15 12:21 |只看该作者
本帖最后由 黑色阳光_cu 于 2013-07-15 12:22 编辑
  1. grep -v '0000' testfile
复制代码
或者

grep -P '^(?:(?!0{4,}).)+$' testfile

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
7 [报告]
发表于 2013-07-15 12:33 |只看该作者
@dn833我感觉你这个写法有点问题
比如你文件a的最后一行的那串数字,写成120000230001试试,会不会被选出来

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
8 [报告]
发表于 2013-07-15 13:29 |只看该作者
明白了,考虑不周。。。。。。
6楼的比较妥,就是不知道那个冒号干嘛用的

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
9 [报告]
发表于 2013-07-15 13:46 |只看该作者
(?:    )是非捕获的分组吧。即这个括号中匹配的内容今后不需要引用的。

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
10 [报告]
发表于 2013-07-15 15:56 |只看该作者
@黑色阳光_cu这个好像也有问题,任意字符前面跟的不是4个以上连续0。
那么0000应该也会被匹配到吧,因为最后一个0属于任意字符,前面是三个零,满足不是4个以上连续0。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP