免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3977 | 回复: 13
打印 上一主题 下一主题

[文本处理] awk中正则表达中重复次数的限制 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-09-14 10:41 |只看该作者 |倒序浏览


QQ:/tmp>cat /tmp/xxx
C
DA

正则表达式,表示重复次数 用如下办法只能到255

用255可以
QQ:/tmp>awk '{if($0 ~ "^.{0,255}$") print "OK"; else print "BAD"}' /tmp/xxx
OK
OK

用256不可以
QQ:/tmp>awk '{if($0 ~ "^.{0,256}$") print "OK"; else print "BAD"}' /tmp/xxx
BAD
BAD
QQ:/tmp>


grep "^.\{0,256\}$" /tmp/xxx
会报错:
Invalid \{\} repetition.

用255则可以。

这个255的限制有没有办法突破呢???

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
2 [报告]
发表于 2015-09-14 10:47 |只看该作者
回复 1# hujysh


    干嘛非得用正则不可?你是要解决问题还是要测试awk正则的极限?

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
3 [报告]
发表于 2015-09-14 10:50 |只看该作者
回复 1# hujysh


估计是版本问题:
  1. $ awk --posix '{if($0 ~ "^.{1,2000}$") print "OK"; else print "BAD"}' file
  2. OK
  3. OK
复制代码

论坛徽章:
0
4 [报告]
发表于 2015-09-14 11:05 |只看该作者
回复 3# ly5066113


    AIX的机器,没有 --posix 选项

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
5 [报告]
发表于 2015-09-14 11:11 |只看该作者
回复 4# hujysh


版本不同而已,说你的原始需求吧,都是可以解决的。

论坛徽章:
0
6 [报告]
发表于 2015-09-14 11:11 |只看该作者
回复 2# MMMIX

要解决问题,问题简化后就是我帖子里面说的。

实际上,是一个检查文件合法性的脚本,检查规则由用户自己配置,他们想用这种类似的配置来检查长度(长度可变,有个范围),

用正则表达式的原因,他们可以定制不同行的不同规则,可以到具体内容的检查。
   

论坛徽章:
0
7 [报告]
发表于 2015-09-14 11:14 |只看该作者
6楼有应用的简单说明。

谢谢!

回复 6# ly5066113


   

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
8 [报告]
发表于 2015-09-14 11:15 |只看该作者
回复 4# hujysh

$ grep -P "^.{0,300}$" /tmp/xxx
C
DA

$ perl -lane  "{print if(/^.{0,300}$/)}" /tmp/xxx
C
DA

Note: It's NOT a good idea for your problem

   

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
9 [报告]
发表于 2015-09-14 11:17 |只看该作者
回复 7# hujysh


长度可以用 length
  1. $ awk '{if(length>=0&&length<=256) print "OK"; else print "BAD"}' file
  2. OK
  3. OK
复制代码

论坛徽章:
0
10 [报告]
发表于 2015-09-14 11:29 |只看该作者
回复 9# ly5066113


是的。谢谢!

这样做要放弃正则了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP