免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2698 | 回复: 15
打印 上一主题 下一主题

[文本处理] 怎样合并文件?(第一列不确定是否完全一样) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-09-25 14:44 |只看该作者 |倒序浏览
如题,假如我有文件A和B,想将其按照第一列标签不变,AB第二列分别附于其后,生成C
A包含内容如下:                          B包含内容如下:
hss  88                                     hss  777
tdg  57                                     tdg  8
hh   6                                       hh   23
...                                            ...
         
预期得到C如下:
hss  777  88
tdg  8      57
hh   23    6
...

实际文件有很多行,现在能看到的第一列貌似一样,但我如何确保AB第一列真的完全一样?然后再输出?

菜鸟求指教!谢谢!

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
2 [报告]
发表于 2014-09-25 15:01 |只看该作者
  1. join b.txt a.txt
复制代码

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
3 [报告]
发表于 2014-09-25 15:08 |只看该作者
本帖最后由 bulletmarquis 于 2014-09-25 15:09 编辑

只输出第一列一样的~
  1. awk 'NR==FNR{a[$1]=$0;next}a[$1]{print a[$1],$2}' b a
复制代码

论坛徽章:
1
处女座
日期:2014-09-18 16:18:00
4 [报告]
发表于 2014-09-25 15:09 |只看该作者
不一样的列是丢掉还是打印呢

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
5 [报告]
发表于 2014-09-25 15:15 |只看该作者
周经贴,鉴定完毕

论坛徽章:
0
6 [报告]
发表于 2014-09-25 15:15 |只看该作者
回复 4# Kasiotao

谢谢大神们 太感动了!

我主要是想确认两个文件第一列是否一样?该怎么办啊
   

论坛徽章:
0
7 [报告]
发表于 2014-09-25 15:17 |只看该作者
菜鸟求放过~~~另外,什么是周经贴?囧~~回复 5# huang6894


   

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
8 [报告]
发表于 2014-09-25 15:21 |只看该作者
回复 7# xunong


    比月经出现还频繁

论坛徽章:
0
9 [报告]
发表于 2014-09-25 15:30 |只看该作者
回复 3# bulletmarquis


    想问下 代码引号里的a不是文件名的意思吧?只是一个函数之类的吗?

论坛徽章:
1
处女座
日期:2014-09-18 16:18:00
10 [报告]
发表于 2014-09-25 15:34 |只看该作者
回复 1# xunong

你看这样行不行,比如你文件里有不一样的,
如A:
  1. hss 88
  2. tdg 57
  3. hh  6
  4. aa  5
复制代码
B:
  1. hss 777 
  2. tdg 8
  3. hh  23  
  4. bb  34  
复制代码
用这个
  1. awk '{a[$1]=$2" "a[$1];b[$1]++}END{for(i in a)if(b[i]==1)print i" "a[i];print"------";for(i in a)if(b[i]>1)print i" "a[i]}' A B
复制代码
输出:
  1. bb 34 
  2. aa 5 
  3. ----
  4. hh 23 6 
  5. tdg 8 57 
  6. hss 777 88
复制代码
这样如果有不一样的列就列在----上面,有一样的就合并在----下面了。
   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP