免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2567 | 回复: 7
打印 上一主题 下一主题

[文本处理] 大神们,来看下awk能能这样处理文本吗 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2019-01-27 09:30 来自手机 |只看该作者 |倒序浏览
如题,要处理的文本是这样的,
(
aaaaaaaaa
hhhhjjj
ABC
jdkdkdj
)
(
hhhh
sdss
xxdd
)
(
hhhhhh
ABC
dxyhdhhh
uuuu
)
文本中还有很多这种格式的内容,现在我想把含有ABC特殊字符串的用()括起来的内容给提取出来,提取后效果如下:
(
hhhhhh
ABC
dxyhdhhh
uuuu
)
(
aaaaaaaaa
hhhhjjj
ABC
jdkdkdj
)
如上,这种用awk能实现吗,想了下awk嵌套awk,没有搞出来,我之前用sed的方式,sed -n '/pattern1/,/pattern2/{p}'来截取,但是只能截取
两个字串之间的内容,如果用awk不能实现,应该怎样实现呢,谢谢大神们

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
2 [报告]
发表于 2019-01-27 21:42 |只看该作者
  1. awk -vRS='[)(]' '/ABC/&&$0="("$0")"' a
  2. (
  3. aaaaaaaaa
  4. hhhhjjj
  5. ABC
  6. jdkdkdj
  7. )
  8. (
  9. hhhhhh
  10. ABC
  11. dxyhdhhh
  12. uuuu
  13. )
复制代码

论坛徽章:
8
CU十四周年纪念徽章
日期:2017-08-28 17:16:1915-16赛季CBA联赛之北控
日期:2018-03-29 11:39:0615-16赛季CBA联赛之上海
日期:2018-05-21 10:46:10技术图书徽章
日期:2018-09-03 13:54:18技术图书徽章
日期:2018-09-03 13:54:2815-16赛季CBA联赛之四川
日期:2020-10-15 09:21:4720周年集字徽章-20	
日期:2020-10-28 13:53:0220周年集字徽章-庆
日期:2020-10-28 14:09:12
3 [报告]
发表于 2019-01-28 11:11 |只看该作者
回复 1# 溜溜孩纸

  1. awk -vRS=")" '/ABC/{print $0RT}' file
复制代码

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
4 [报告]
发表于 2019-02-13 13:15 |只看该作者
  1. sed -n '/(/{:a;N;/)/!ba;/ABC/p}'
复制代码

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
5 [报告]
发表于 2019-02-13 13:18 |只看该作者
sed 思路,遇到(开始,设置标签a,然后不断的N追加,遇到) 不再追加。等于是
(
....
) 当做一个block来处理,然后看是否匹配ABC, 匹配打印。

a是标签,ba就是无条件跳转到标签处。除非不满足条件。

论坛徽章:
0
6 [报告]
发表于 2019-02-23 14:59 |只看该作者
回复 5# expert1

厉害

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
7 [报告]
发表于 2019-02-24 10:02 |只看该作者
回复 6# hechao7021

sed还可以这样, 利用H把符号条件的()放到PS里面,然后匹配。
sed -n 'H;/(/h;/)/{g;/ABC/p}'

sed   -n 'H;/(/h;/)/{x;/ABC/p}'


推荐第二个



论坛徽章:
0
8 [报告]
发表于 2019-02-25 11:19 |只看该作者

$ cat 1.txt
(
aaaaaaaaa
hhhhjjj
ABC
jdkdkdj
)
(
hhhh
sdss
xxdd
)
(
hhhhhh
ABC
dxyhdhhh
uuuu
)

$ awk '{a=a?a"\n"$0:$0;} /ABC/{c=1} /)/{if (c==1)print a; c=0; a=""}' 1.txt
(
aaaaaaaaa
hhhhjjj
ABC
jdkdkdj
)
(
hhhhhh
ABC
dxyhdhhh
uuuu
)
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP