免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3524 | 回复: 18
打印 上一主题 下一主题

awk/sed 查找对照表问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-04-01 14:28 |只看该作者 |倒序浏览
有两个文件1.txt、2.txt
1.txt:
1
23
033
04567

2.txt
1 first
23 second
033 thrid
04567 fourth

其中2是对照表。请问如何用awk/sed,将1.txt内容替换为
first
second
thrid
fourth

普通的shell语句会写(使用while读每一行,在2.txt中查找、替换,生成新文件),但是如果1.txt和2.txt都有上千万行的话,效率很低。有没有比较高效的方法来解决这个问题呢?

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
2 [报告]
发表于 2010-04-01 14:33 |只看该作者
回复 1# yhou31


    hash.
    追求高效就用perl吧。

论坛徽章:
0
3 [报告]
发表于 2010-04-01 14:49 |只看该作者
回复 1# yhou31


    把2的数字去掉也行吧?
sed 's/[^ ]* //'

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
4 [报告]
发表于 2010-04-01 14:49 |只看该作者
  1. awk 'NR==FNR{a[$1]=$2;next}{print a[$1]}' 2.txt 1.txt
复制代码

论坛徽章:
0
5 [报告]
发表于 2010-04-01 14:52 |只看该作者
回复 3# iori809


    你这个太水了。。。
   把2的数字去掉 ,你还不如直接去2的第2列 > 1.txt 岂不是更爽?
   LZ的意思很明显是举例子,文件肯定不会就是这样2行,或者顺序不一定就是这样。。。

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
6 [报告]
发表于 2010-04-01 14:53 |只看该作者
本帖最后由 blackold 于 2010-04-01 15:10 编辑
  1. grep -Fwf 1.txt 2.txt|cut -d\  -f2
复制代码
不好意思,这个结果不符合要求。

论坛徽章:
0
7 [报告]
发表于 2010-04-01 14:54 |只看该作者
回复 5# 709101040516


    哈哈~发完以后我就后悔了~哎刚说完别人自己就出丑了~以后要小心谨慎了~尤其是你在线的时候

论坛徽章:
0
8 [报告]
发表于 2010-04-01 15:03 |只看该作者
回复 4# blackold


    强!能解释下吗?

论坛徽章:
0
9 [报告]
发表于 2010-04-01 15:09 |只看该作者
awk 'NR==FNR{array[$1]=$2}NR>FNR && $1 in array{print array[$1]}'
呵呵 从新写个

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
10 [报告]
发表于 2010-04-01 15:10 |只看该作者
回复 8# yhou31


    awk基础。看一下贴子吧。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP