免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2481 | 回复: 4
打印 上一主题 下一主题

[文本处理] 正则表达式 awk [复制链接]

论坛徽章:
2
辰龙
日期:2013-09-24 12:26:05卯兔
日期:2013-09-24 12:27:37
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-08-16 16:29 |只看该作者 |倒序浏览
在awk 中做如下替换,去掉<> 和中间的内容
  1. yy@aa ~/awk
  2. $ cat a
  3. <"req" > bb <ss> cc
  4. <aa xxx
  5. xxxxx
  6. >

  7. yy@aa ~/awk
  8. $ awk '{gsub(/<.*>/, "") ;print }'  a
  9. cc
  10. <aa xxx
  11. xxxxx
  12. >
复制代码
匹配最长的了,但是我想保留 bb cc,不知道该怎样做?
另外还有形如
<aa xxx
xxxxx
>
不在同一行上的,我也想替换掉

求助。




论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
2 [报告]
发表于 2013-08-16 16:45 |只看该作者
回复 1# chenxing0407
  1. awk -F'(<[^>]+>|\n)' -vRS= 'NF+=0'
复制代码

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
3 [报告]
发表于 2013-08-16 17:18 |只看该作者
本帖最后由 代号:军刀 于 2013-08-16 17:18 编辑
  1. sed ':a;N;s/<[^<]*>//;ta'
复制代码

论坛徽章:
2
辰龙
日期:2013-09-24 12:26:05卯兔
日期:2013-09-24 12:27:37
4 [报告]
发表于 2013-08-17 21:35 |只看该作者
谢谢2位了

论坛徽章:
2
辰龙
日期:2013-09-24 12:26:05卯兔
日期:2013-09-24 12:27:37
5 [报告]
发表于 2013-08-22 23:28 |只看该作者
回复 2# yinyuemi


    RS= 'NF+=0' 这个该怎么理解
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP