免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1367 | 回复: 4
打印 上一主题 下一主题

[文本处理] 第一列相同合并成多行 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-03-16 23:09 |只看该作者 |倒序浏览
1.
1464816373904413 abcde 12345 1.1.1.1
1464816373904413 abcde 12345 2.2.2.2

2.
1464816373904413 AAA VfJUEMi
1464816373904413 BBB QzKYGKi
1464816373904413 CCC eHLOjIi
有两个文件如上,想打印出如下行
1464816373904413  abcde 12345 1.1.1.1 AAA VfJUEMi BBB QzKYGKi CCC eHLOjIi
1464816373904413  abcde 12345 2.2.2.2 AAA VfJUEMi BBB QzKYGKi CCC eHLOjIi

两文件数据分别约2万行,要考虑到效率。

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
2 [报告]
发表于 2015-03-16 23:39 |只看该作者
  1. awk 'FNR==NR{a[$1]=a[$1]" "$2" "$3;next}{if(a[$1]) print $0,a[$1]}' file2 file1
  2. 1464816373904413 abcde 12345 1.1.1.1  AAA VfJUEMi BBB QzKYGKi CCC eHLOjIi
  3. 1464816373904413 abcde 12345 2.2.2.2  AAA VfJUEMi BBB QzKYGKi CCC eHLOjIi
复制代码
回复 1# whh1982
试试吧,两万行估计没啥问题!


   

论坛徽章:
28
2015年迎新春徽章
日期:2015-03-04 10:16:53午马
日期:2015-03-20 17:11:07亥猪
日期:2015-03-20 17:11:23戌狗
日期:2015-03-20 17:11:33酉鸡
日期:2015-03-20 17:11:47申猴
日期:2015-03-20 17:11:58未羊
日期:2015-03-20 17:12:10子鼠
日期:2015-03-20 17:12:23丑牛
日期:2015-03-20 17:12:40卯兔
日期:2015-03-20 17:12:51辰龙
日期:2015-03-20 17:13:00巳蛇
日期:2015-03-20 17:13:12
3 [报告]
发表于 2015-03-17 00:32 |只看该作者
  1. awk 'NR<4{for(i=1;i++<NF;)a[$1]=a[$1]" "$i;next}{a[$1]?$0=$0" "a[$1]:1}1' inputfile2 inputfile1
复制代码

论坛徽章:
7
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:57:092015小元宵徽章
日期:2015-03-06 15:58:18程序设计版块每日发帖之星
日期:2015-08-09 06:20:00每日论坛发贴之星
日期:2015-08-09 06:20:00程序设计版块每日发帖之星
日期:2015-08-22 06:20:00程序设计版块每日发帖之星
日期:2015-08-27 06:20:00
4 [报告]
发表于 2015-03-17 01:06 |只看该作者
join 1 2 | awk '{a[$1" "$2" "$3" "$4]=a[$1" "$2" "$3" "$4]" "$5" "$6}END{for (i in a) print a[i]}'

论坛徽章:
0
5 [报告]
发表于 2015-03-17 14:01 |只看该作者
回复 2# zxy877298415
赞,这个可以满足

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP