免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 5027 | 回复: 20
打印 上一主题 下一主题

[文本处理] awk两个文本局部替换的问题? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-11-10 20:54 |只看该作者 |倒序浏览
有两个文件1和2,如何用awk实现把1中的各行替换到相应2中,替换第一个*,得到文件3.txt。
1.txt内容:
ZSJN 101200Z VRB01MPS  NOSIG
ZUUU 101200Z VRB01MPS  NOSIG

2.txt内容:
ZSJN::*::*::034,025,14.6<br>ZUUU::*::*::034,025,14.6<br>

得到3.txt:
ZSJN::ZSJN 101200Z VRB01MPS  NOSIG::*::034,025,14.6<br>ZUUU::ZUUU 101200Z VRB01MPS  NOSIG::*::034,025,14.6<br>

论坛徽章:
0
2 [报告]
发表于 2015-11-10 21:45 |只看该作者
本帖最后由 lgfang 于 2015-11-10 21:45 编辑
  1. awk -v FS='::' -v OFS='::' 'NR==FNR{a[NR]=$0}NR!=FNR{$2=a[FNR];print $0}' 1.txt 2.txt >3.txt
复制代码

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
3 [报告]
发表于 2015-11-10 22:04 |只看该作者
  1. awk -F'<br>' 'NR==FNR{a[NR]=$0;next}{for(i=1;i<NF;i++){sub("\\*",a[i],$i);printf $i FS}}' b c
复制代码

论坛徽章:
12
IT运维版块每日发帖之星
日期:2015-11-17 06:20:00程序设计版块每日发帖之星
日期:2016-01-19 06:20:0015-16赛季CBA联赛之江苏
日期:2016-01-17 15:31:3915-16赛季CBA联赛之上海
日期:2016-01-16 15:44:3015-16赛季CBA联赛之浙江
日期:2016-01-15 20:38:1815-16赛季CBA联赛之北京
日期:2016-01-09 14:30:15CU十四周年纪念徽章
日期:2016-01-07 12:31:5115-16赛季CBA联赛之四川
日期:2016-01-01 11:49:1515-16赛季CBA联赛之深圳
日期:2015-12-24 14:23:4115-16赛季CBA联赛之山西
日期:2015-12-15 16:22:31技术图书徽章
日期:2015-12-10 17:41:0015-16赛季CBA联赛之北控
日期:2016-02-03 10:03:24
4 [报告]
发表于 2015-11-10 23:56 |只看该作者
awk  'NR==FNR{a[$1]=$0;next}{for(i in a){m=i"::\\*";n=i"::"a[i];gsub(m,n)}}1' 1.txt 2.txt

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
5 [报告]
发表于 2015-11-11 08:18 |只看该作者
本帖最后由 jason680 于 2015-11-11 08:22 编辑

回复 1# moto1717

$ awk 'FNR==NR{a[$1]=$0;next}{str=$0;while(match(str,/([a-zA-Z]+)::\*/,m)){s=RSTART;n=RLENGTH;out=out substr(str,1,s) m[1]"::"a[m[1]];str=substr(str,s+n)}print out str}' 1.txt 2.txt
ZZSJN::ZSJN 101200Z VRB01MPS  NOSIG::*::034,025,14.6<br>ZZUUU::ZUUU 101200Z VRB01MPS  NOSIG::*::034,025,14.6<br>


   

论坛徽章:
0
6 [报告]
发表于 2015-11-11 11:05 |只看该作者
回复 4# sync_1521
真行啊,谢谢了,请问一下,这个命令对多条适用吗,如果需要替换的第一星号是一串字符的,该怎么调整命令,谢谢了

   

论坛徽章:
0
7 [报告]
发表于 2015-11-11 11:17 |只看该作者
回复 4# sync_1521
你好,我刚才试了一下,对多条也是适用的,但是如果把2.txt中的第一个星号改成字符就不行,比如改为ZSJN::ZSJN 111200Z VRB01MPS  NOSIG::*::034,025,14.6<br>,请问该如何解决呢,谢谢了

   

论坛徽章:
12
IT运维版块每日发帖之星
日期:2015-11-17 06:20:00程序设计版块每日发帖之星
日期:2016-01-19 06:20:0015-16赛季CBA联赛之江苏
日期:2016-01-17 15:31:3915-16赛季CBA联赛之上海
日期:2016-01-16 15:44:3015-16赛季CBA联赛之浙江
日期:2016-01-15 20:38:1815-16赛季CBA联赛之北京
日期:2016-01-09 14:30:15CU十四周年纪念徽章
日期:2016-01-07 12:31:5115-16赛季CBA联赛之四川
日期:2016-01-01 11:49:1515-16赛季CBA联赛之深圳
日期:2015-12-24 14:23:4115-16赛季CBA联赛之山西
日期:2015-12-15 16:22:31技术图书徽章
日期:2015-12-10 17:41:0015-16赛季CBA联赛之北控
日期:2016-02-03 10:03:24
8 [报告]
发表于 2015-11-11 12:14 |只看该作者
回复 7# moto1717

awk  'NR==FNR{a[$1]=$0;next}{for(i in a){m=i"::[^:]*";n=i"::"a;gsub(m,n)}}1' 1.txt 2.txt


   

论坛徽章:
0
9 [报告]
发表于 2015-11-11 12:31 |只看该作者
没留意到第二文件是一行。改成这样就行了

  1. cat 2.txt | sed 's/<br>/\n/g' | awk -v FS='::' -v OFS='::' 'NR==FNR{a[NR]=$0} NR!=FNR{$2=a[FNR];print $0}'  1.txt - > 3.txt
复制代码
3.txt 文件末尾会多出来一行'::'。应该不是问题,手工删掉就行。或者再加一个限定条件:非空行

  1. cat 2.txt | sed 's/<br>/\n/g' | awk -v FS='::' -v OFS='::' 'NR==FNR{a[NR]=$0} NR!=FNR&&!/^$/{$2=a[FNR];print $0}'  1.txt - > 3.txt
复制代码

论坛徽章:
0
10 [报告]
发表于 2015-11-11 12:31 |只看该作者
本帖最后由 lgfang 于 2015-11-11 12:33 编辑

发重了。不能删?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP