免费注册 查看新帖 |

ChinaUnix.net

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1598 | 回复: 7

[文本处理] 大神们,来看下awk能能这样处理文本吗 [复制链接]

论坛徽章:
0
发表于 2019-01-27 09:30 来自手机 |显示全部楼层
如题,要处理的文本是这样的,
(
aaaaaaaaa
hhhhjjj
ABC
jdkdkdj
)
(
hhhh
sdss
xxdd
)
(
hhhhhh
ABC
dxyhdhhh
uuuu
)
文本中还有很多这种格式的内容,现在我想把含有ABC特殊字符串的用()括起来的内容给提取出来,提取后效果如下:
(
hhhhhh
ABC
dxyhdhhh
uuuu
)
(
aaaaaaaaa
hhhhjjj
ABC
jdkdkdj
)
如上,这种用awk能实现吗,想了下awk嵌套awk,没有搞出来,我之前用sed的方式,sed -n '/pattern1/,/pattern2/{p}'来截取,但是只能截取
两个字串之间的内容,如果用awk不能实现,应该怎样实现呢,谢谢大神们

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
发表于 2019-01-27 21:42 |显示全部楼层
  1. awk -vRS='[)(]' '/ABC/&&$0="("$0")"' a
  2. (
  3. aaaaaaaaa
  4. hhhhjjj
  5. ABC
  6. jdkdkdj
  7. )
  8. (
  9. hhhhhh
  10. ABC
  11. dxyhdhhh
  12. uuuu
  13. )
复制代码

论坛徽章:
5
CU十四周年纪念徽章
日期:2017-08-28 17:16:1915-16赛季CBA联赛之北控
日期:2018-03-29 11:39:0615-16赛季CBA联赛之上海
日期:2018-05-21 10:46:10技术图书徽章
日期:2018-09-03 13:54:18技术图书徽章
日期:2018-09-03 13:54:28
发表于 2019-01-28 11:11 |显示全部楼层
回复 1# 溜溜孩纸

  1. awk -vRS=")" '/ABC/{print $0RT}' file
复制代码

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
发表于 2019-02-13 13:15 |显示全部楼层
  1. sed -n '/(/{:a;N;/)/!ba;/ABC/p}'
复制代码

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
发表于 2019-02-13 13:18 |显示全部楼层
sed 思路,遇到(开始,设置标签a,然后不断的N追加,遇到) 不再追加。等于是
(
....
) 当做一个block来处理,然后看是否匹配ABC, 匹配打印。

a是标签,ba就是无条件跳转到标签处。除非不满足条件。

论坛徽章:
0
发表于 2019-02-23 14:59 |显示全部楼层
回复 5# expert1

厉害

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
发表于 2019-02-24 10:02 |显示全部楼层
回复 6# hechao7021

sed还可以这样, 利用H把符号条件的()放到PS里面,然后匹配。
sed -n 'H;/(/h;/)/{g;/ABC/p}'

sed   -n 'H;/(/h;/)/{x;/ABC/p}'


推荐第二个



论坛徽章:
0
发表于 2019-02-25 11:19 |显示全部楼层

$ cat 1.txt
(
aaaaaaaaa
hhhhjjj
ABC
jdkdkdj
)
(
hhhh
sdss
xxdd
)
(
hhhhhh
ABC
dxyhdhhh
uuuu
)

$ awk '{a=a?a"\n"$0:$0;} /ABC/{c=1} /)/{if (c==1)print a; c=0; a=""}' 1.txt
(
aaaaaaaaa
hhhhjjj
ABC
jdkdkdj
)
(
hhhhhh
ABC
dxyhdhhh
uuuu
)
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

基于案例的 SQL 优化实战训练营

讲师:中电福富特级专家梁敬彬,参与本次课程培训,你将收获:
1. 能编写出较为高效的 SQL;
2. 能解决70%以上的数据库常见优化问题;
3. 能得到老师提供的高效的相关工具和解决方案;
4. 能举一反三,收获不仅仅是 SQL 优化。
现在购票享受8.8折优惠!
----------------------------------------
优惠时间:2019年3月20日前

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP