免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1674 | 回复: 3
打印 上一主题 下一主题

[文本处理] awk 命令转 到脚本 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-02-07 17:06 |只看该作者 |倒序浏览
本帖最后由 antonym55 于 2015-02-07 17:07 编辑

file1
no1 name1
no2 name2
no3 name2
no4 name3
no5 name4
no6 name4
no7 name4
no8 name5
no9 name6
no10 name6

file2
name1 data1 dada2 data3 data4 dada5
name2 dada6 data7 dada8
name3 data9 dada10 data11 dada12
name4 data13 dada14
name5 data15 dada16
name6 data17 data18


如果file1的第2列跟file2的第1列匹配,则将两条数据合并成一条,合并后的数据应该是这样的:
no1 name1 data1 dada2 data3 data4 dada5
no2 name2 dada6 data7 dada8
no3 name2 dada6 data7 dada8
no4 name3 data9 dada10 data11 dada12
no5 name4 data13 dada14
no6 name4 data13 dada14
no7 name4
no8 name5 data15 dada16
no9 name6 data17 data18
no10 name6 data17 data18

程序:

awk 'NR==FNR{a[$1]=$0}NR>FNR{print $1" "a[$2]}' file2 file1


用命令行结果不是这样的,gawk 是3.1.7,用gawk.exe 3.1.6就是文档中的结果

改成 x.awk, 结果就完全不同了

BEGIN{
}
{
  if (NR==FNR)
  {
          a[$1]=$0;
  }
  if (NR>FNR)
  {
          print $1" "a[$2]
  }
}
END{
}




我想用x.awk 得到文档中的结果,请问该怎么修改?谢谢!







论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
2 [报告]
发表于 2015-02-07 17:18 |只看该作者
本帖最后由 聆雨淋夜 于 2015-02-07 17:24 编辑

awk --version
GNU Awk 3.1.7
  1. awk 'NR==FNR{a[$2]=$1;next}{print a[$1],$0}' file1 file2
  2. no1 name1 data1 dada2 data3 data4 dada5
  3. no3 name2 dada6 data7 dada8
  4. no4 name3 data9 dada10 data11 dada12
  5. no7 name4 data13 dada14
  6. no8 name5 data15 dada16
  7. no10 name6 data17 data18
复制代码

论坛徽章:
0
3 [报告]
发表于 2015-02-07 17:26 |只看该作者
回复 2# 聆雨淋夜


   版本不同,结果也不同呀,你这个在gawk 3.1.7中是OK的,但在3.1.6里面就成了

no1 name1 data1 dada2 data3 data4 dada5
no3 name2 dada6 data7 dada8
no4 name3 data9 dada10 data11 dada12
no7 name4 data13 dada14
no8 name5 data15 dada16
no10 name6 data17 data18


中间有几个没有了,用这个在3.1.6里面就OK了
awk 'NR==FNR{a[$1]=$0}NR>FNR{print $1" "a[$2]}' file2 file1

论坛徽章:
7
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:57:092015小元宵徽章
日期:2015-03-06 15:58:18程序设计版块每日发帖之星
日期:2015-08-09 06:20:00每日论坛发贴之星
日期:2015-08-09 06:20:00程序设计版块每日发帖之星
日期:2015-08-22 06:20:00程序设计版块每日发帖之星
日期:2015-08-27 06:20:00
4 [报告]
发表于 2015-02-09 11:32 |只看该作者
一定要awk么?join不是更直接吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP