免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1767 | 回复: 8
打印 上一主题 下一主题

救命用的!匹配两个文件的某列,然后替换 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-04-25 21:22 |只看该作者 |倒序浏览
有两个文件:
a.txt

ASDFAS|AF|12341234
TRYERYE|HL|457564
ZXVCZXVC|CD|45745
XCVBCXVB|HC|657457656
ASFJYJYYJJY|OP|34634644

b.txt

AF|AF
HL|HK
CD|CP
HC|HK

如何匹配a的第三列跟b的第一列,如果匹配就用b的第二列替换a 的第三列,如果不匹配则保持不变,也就是变成下面:

ASDFAS|AF|12341234
TRYERYE|HC|457564
ZXVCZXVC|CP|45745
XCVBCXVB|HK|657457656
ASFJYJYYJJY|OP|34634644

论坛徽章:
0
2 [报告]
发表于 2009-04-25 22:04 |只看该作者

  1. awk -F'|' -v OFS='|' 'NR==FNR{a[FNR]=$1;b[FNR]=$2}NR!=FNR{if(a[FNR]==$2)$2=b[FNR];print}' b.txt a.txt
复制代码

论坛徽章:
0
3 [报告]
发表于 2009-04-25 22:11 |只看该作者
虽然你问的问题错误百出,不过我想这是你要的
  1. awk 'BEGIN{FS=OFS="|"}NR==FNR{a[$1]=$2}NR>FNR{if (a[$2]) sub($2,a[$2],$2);print}' b.txt a.txt
复制代码

论坛徽章:
0
4 [报告]
发表于 2009-04-25 22:25 |只看该作者

回复 #1 cosoo 的帖子

我试了下, 这样好像可以。。。

awk 'BEGIN{OFS=FS="|"}NR==FNR{a[$1]=$2}NR>FNR{$2=a[$2];print}' b.txt a.txt > c.txt

论坛徽章:
0
5 [报告]
发表于 2009-04-25 22:32 |只看该作者
你觉得if (a[$2])这个条件不需要吗?
如果不匹配则保持不变

论坛徽章:
0
6 [报告]
发表于 2009-04-26 07:43 |只看该作者
如果是行对行的匹配,那么

  1. awk -F'|' -v OFS='|' 'NR==FNR{a[FNR]=$1;b[FNR]=$2}NR!=FNR{if(a[FNR]==$2)$2=b[FNR];print}' b.txt a.txt
复制代码


如果不考虑行对应,只要关键字对应

  1. awk 'BEGIN{FS=OFS="|"}NR==FNR{a[$1]=$2}NR>FNR{if (a[$2]) $2=a[$2];print}' b.txt a.txt
复制代码

论坛徽章:
0
7 [报告]
发表于 2009-04-26 07:45 |只看该作者
原帖由 cosoo 于 2009-4-25 22:25 发表
我试了下, 这样好像可以。。。

awk 'BEGIN{OFS=FS="|"}NR==FNR{a[$1]=$2}NR>FNR{$2=a[$2];print}' b.txt a.txt > c.txt


这个有问题,当没有对应的关键字的时候,a.txt的第二个字段会是空的

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
8 [报告]
发表于 2009-04-26 08:48 |只看该作者

回复 #3 ywlscpl 的帖子

判断key值的存在,还是用if ($2 in a)最好
if (a[$2]) 会有2个问题:
1、a[$2]=0或a[$2]=""时,条件为假
2、$2不在a中时,会增加数组a的元素个数,使得数组越来越大

论坛徽章:
0
9 [报告]
发表于 2009-04-26 08:53 |只看该作者

回复 #8 ly5066113 的帖子

受教了
以后得注意了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP