免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2054 | 回复: 2
打印 上一主题 下一主题

[文本处理] sed and awk sos [复制链接]

论坛徽章:
6
程序设计版块每日发帖之星
日期:2016-05-11 06:20:00操作系统版块每日发帖之星
日期:2016-05-12 06:20:00每日论坛发贴之星
日期:2016-05-12 06:20:00操作系统版块每日发帖之星
日期:2016-05-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-31 06:20:00每日论坛发贴之星
日期:2016-05-31 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2018-01-14 09:44 |只看该作者 |倒序浏览
本帖最后由 1cpuer 于 2018-01-15 10:42 编辑

http://blog.csdn.net/msw521sg/article/details/53212508

sed -rn '/^[^0-9]/H;/^[0-9]/{G;/(.)( .)( .)\n\n.\2( [^ ])( [^ ]).*/s//\1\2\3\4\5/p}' b.txt a.txt

kong de
awk ye shi

# [ /home/soio/1bs/awks ] {2018-01-15 10:24:31} : 1515983071:0;
# sed -rn '/^[^0-9]/H;/^[0-9]/{G;/(.)( *)( [^ ]*)\n\n.\2( [^ ]*)( [^ ]*).*/s//\1\2\3\5/p}' b.txt a.txt
01 12510101 4001 2006/02/15
02 12310001 4002 2006/02/15
03 12550101 4003 2006/02/15
04 12610001 4004 2006/02/15
05 12810001 4005 2006/02/15
06 12310001 4006 2006/02/15
07 12710001 4007 2006/02/15
08 12310001 4008 2006/02/15
09 12810101 4009 2006/02/15
10 12510101 4010 2006/02/15
11 12310001 4011 2006/02/15
12 12610001 4012 2006/02/15
13 12310001 4013 2006/02/15


# [ /home/soio/1bs/awks ] {2018-01-15 10:24:53} : 1515983093:0;
# sed -rn '/^[^0-9]/H;/^[0-9]/{G;/(.)( *)( [^ ]*)\n\n.\2( [^ ]*)( [^ ]*).*/s//\1\2\3\4\5/p}' b.txt a.txt
01 12510101 4001 12410101 2006/02/15
02 12310001 4002 12410101 2006/02/15
03 12550101 4003 12410101 2006/02/15
04 12610001 4004 12410101 2006/02/15
05 12810001 4005 12410101 2006/02/15
06 12310001 4006 12410101 2006/02/15
07 12710001 4007 12410101 2006/02/15
08 12310001 4008 12410101 2006/02/15
09 12810101 4009 12410101 2006/02/15
10 12510101 4010 12410101 2006/02/15
11 12310001 4011 12410101 2006/02/15
12 12610001 4012 12410101 2006/02/15
13 12310001 4013 12410101 2006/02/15


# [ /home/soio/1bs/awks ] {2018-01-15 10:36:10} : 1515983770:0;
# cat a1.txt
01 c1 4001
02 c2 4002


# [ /home/soio/1bs/awks ] {2018-01-15 10:37:42} : 1515983862:0;
# cat b1.txt
A c1 2006/02/15 2009/01/31 4002
B c2 2006/08/31 2008/08/29 4001
C c6 2008/05/23 2008/05/22 4002
D c8 1992/12/10 1993/06/30 4001
E c6 1992/05/11 1993/06/01 4005

# [ /home/soio/1bs/awks ] {2018-01-15 10:35:36} : 1515983736:0;
# sed -rn '/^[^0-9]/H;/^[0-9]/{G;/(.)( *)( [^ ]*)\n\n.\2( [^ ]*)( [^ ]*)( [^ ]*).*/s//\1\2\3\5\6/p}' b1.txt a1.txt
01 c1 4001 2006/02/15 2009/01/31
02 c2 4002 2006/02/15 2009/01/31


论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
2 [报告]
发表于 2018-01-14 16:37 |只看该作者

$ cat 1
01 12510101 4001
02 12310001 4002
03 12550101 4003
04 12610001 4004
05 12810001 4005
06 12310001 4006
07 12710001 4007
08 12310001 4008
09 12810101 4009
10 12510101 4010
11 12310001 4011
12 12610001 4012
13 12310001 4013

$ cat 2
A 12410101 2006/02/15 2009/01/31 4002
B 12310001 2006/08/31 2008/08/29 4001
C 12610001 2008/05/23 2008/05/22 4002
D 12810001 1992/12/10 1993/06/30 4001
E 12660001 1992/05/11 1993/06/01 4005

需求:文件1中第二个字段的内容存在于文件2中的第二个字段的话就输出该行,并把文件2中的两个日期内容添加在该行后:
02 12310001 4002  2006/08/31 2008/08/29
04 12610001 4004  2008/05/23 2008/05/22
05 12810001 4005  1992/12/10 1993/06/30
06 12310001 4006  2006/08/31 2008/08/29
08 12310001 4008  2006/08/31 2008/08/29
11 12310001 4011  2006/08/31 2008/08/29
12 12610001 4012  2008/05/23 2008/05/22
13 12310001 4013 2006/08/31 2008/08/29
  1. awk 'NR==FNR{a[$2]=$3" "$4;next}a[$2]{print $0,a[$2]}' 2 1
复制代码



论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
3 [报告]
发表于 2018-01-14 17:34 |只看该作者
回复 1# 1cpuer

the $ was gone

$ awk 'FNR==NR{a[$2]=$3 FS $4;next}{if($2 in a)print $0,a[$2]}' b.txt a.txt
02 12310001 4002 2006/08/31 2008/08/29
04 12610001 4004 2008/05/23 2008/05/22
...

$ head -n4 b.txt a.txt
==> b.txt <==
A 12410101 2006/02/15 2009/01/31 4002
B 12310001 2006/08/31 2008/08/29 4001
C 12610001 2008/05/23 2008/05/22 4002
D 12810001 1992/12/10 1993/06/30 4001

==> a.txt <==
01 12510101 4001
02 12310001 4002
03 12550101 4003
04 12610001 4004

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP