免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 7627 | 回复: 8
打印 上一主题 下一主题

[文本处理] 用awk和sed实现模糊匹配替换 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-11-27 11:37 |只看该作者 |倒序浏览
0|3|0|1|1|13915981874|520|25|8613915981|20||||46001391598187|20121127095746|20121127095778|0|0||1||||025|25|0000|0000|||||11110||||||0||||||||||||520|1111000000|
处理后:
0|3|0|1|1|13915981874|520|25|8613915981|20||||46001391598187|||0|0||1||||025|25|0000|0000|||||11110||||||0||||||||||||520|1111000000|

要求:将其中匹配2012的字符串:20121127095746和20121127095778替换为空 (这两个除了2012为常量,其它均为变化的数值)

awk -F '|' '{gsub(/……2012/,"")}{print}' abc.txt
这个只能将2012规格掉,不符合要求,请问有什么办法么?

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
2 [报告]
发表于 2012-11-27 11:43 |只看该作者
本帖最后由 rdcwayx 于 2012-11-27 13:44 编辑
  1. awk '{for (i=1;i<=NF;i++) if ($i~/2012/) $i=""}1' FS=\| OFS=\| infile
复制代码

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
3 [报告]
发表于 2012-11-27 12:20 |只看该作者
  1. sed 's/2012[0-9]\{10\}//g' urfile
复制代码

论坛徽章:
0
4 [报告]
发表于 2012-11-27 13:00 |只看该作者
~/2012/:~是不是可以理解为模糊匹配
2012[0-9]\{10\}:10应该是位数
多谢楼上两位.

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
5 [报告]
发表于 2012-11-27 13:51 |只看该作者
  1. sed 's/[^|]*2012[^|]*//g' file
复制代码

论坛徽章:
8
双子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12处女座
日期:2013-09-23 11:43:14处女座
日期:2013-10-09 19:48:21狮子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13双鱼座
日期:2014-06-13 21:52:31
6 [报告]
发表于 2012-11-27 15:36 |只看该作者
  1. perl -F'\|' -lane 'print  if s/$F[14]// && s/$F[15]//'
复制代码

论坛徽章:
0
7 [报告]
发表于 2012-11-27 16:13 |只看该作者
来一个复杂一点,大材小用的awk
  1. awk -F"|" 'BEGIN{OFS="|"}{for (i=1;i<=NF;i++) { if ($i ~ /2012........./) $i=""}print}'  file
复制代码

论坛徽章:
0
8 [报告]
发表于 2012-11-27 17:49 |只看该作者
这个.....好象很有意思嘛回复 7# vic260844


   

论坛徽章:
0
9 [报告]
发表于 2012-11-27 17:49 |只看该作者
没有用过perf,也谢了回复 6# kernel69


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP