免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2265 | 回复: 7
打印 上一主题 下一主题

gawk 正则分割难题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-11-29 01:57 |只看该作者 |倒序浏览
cat sample.txt
hello;James; Dean;Tom;Lucy
ads; coming;really;let; us;have a talk
okay1;good;x;bla; bla
okay2;thank; you;x;bye;bye

现在要按照';'做分隔符,但是如果';'后面紧跟空格,则不可以作为分隔符,而是内容。现在要输出第3列为'x'的行中第二列的值:
good // okay;good;x;bye ;bye 符合要求
thank; you // okay2;thank; you;x;bye;bye  符合要求

假设该文件有10000行,且列不固定,但是列数至少大于3且所有列不为空. 期望写成的awk程序尽可能短,能不用循环判断切割最好。 ps: 其他命令也可

[ 本帖最后由 temp0411 于 2009-11-29 02:21 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2009-11-29 03:08 |只看该作者
perl -lne '@f=split /;(?! )/;print $f[1] if $f[2] eq "x"'

论坛徽章:
0
3 [报告]
发表于 2009-11-29 03:13 |只看该作者
如果你的文本里没有像@@这种特殊字符串的话,可以先替换一下:
sed 's/; /@@/g' | gawk -F';' '$3=="x"{print $2}' | gsed 's/@@/; /g'

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
4 [报告]
发表于 2009-11-29 08:03 |只看该作者

回复 #1 temp0411 的帖子

转换一下再用awk,或者用perl正则(perl, grep)

论坛徽章:
0
5 [报告]
发表于 2009-11-29 11:08 |只看该作者
原帖由 lululau 于 2009-11-29 03:13 发表
如果你的文本里没有像@@这种特殊字符串的话,可以先替换一下:
sed 's/; /@@/g' | gawk -F';' '$3=="x"{print $2}' | gsed 's/@@/; /g'


@是不可以的,最多只能用 \n 替换

论坛徽章:
0
6 [报告]
发表于 2009-11-29 11:11 |只看该作者
perl 正则真是强大,看来有必要得学习下这门语言了

受老黑启发:
grep -P -o '^([^;]|; )+;([^;]|; )+(?=;x;(?! ))' sample.txt | grep -P -o '(?<=[^ ].*$'

[ 本帖最后由 temp0411 于 2009-11-29 15:15 编辑 ]

论坛徽章:
0
7 [报告]
发表于 2009-11-29 17:36 |只看该作者
学习

论坛徽章:
0
8 [报告]
发表于 2009-11-30 09:59 |只看该作者
原帖由 lululau 于 2009-11-29 03:08 发表
perl -lne '@f=split /;(?! )/;print $f[1] if $f[2] eq "x"'


顶。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP