免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: taocb006
打印 上一主题 下一主题

急求教:二个文件按一字段值进行合并 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2007-01-17 16:55 |只看该作者
原帖由 一梦如是 于 2007-1-17 16:48 发表
  1. join -t"|" -j1 3 -j2 1 -o 1.1 1.2 2.2 1.4 1.5 <(sort -t"|" -k3,3 A) <(sed 's/ \+/|/g' B|sort -t"|" -k1,1)
复制代码


Eden兄受awk兄的影响颇深阿~



想用join的...分隔符不同就放弃了, 没必要复杂问题...嘿嘿
该hash的时候不能手软^_^

论坛徽章:
0
12 [报告]
发表于 2007-01-17 17:33 |只看该作者
我开始也有用join的冲动~
但 join 之前需要先进行处理(分隔符、排序),不用临时文件就得写成 <(sort ...) 的形式,hp-ux 没法测试就放弃了 :D

论坛徽章:
0
13 [报告]
发表于 2007-01-17 17:51 |只看该作者
对了,join 方法我原来是这么写的,主要是因为有问题没贴上:
  1. join -1 3 -2 1 -o 1.1,1.2,2.2,1.4,1.5 -a 1 -t'|' <( sort -t'|' -k3 A ) <( xargs -n2 < B |tr ' ' '|' )
复制代码

论坛徽章:
0
14 [报告]
发表于 2007-01-17 17:53 |只看该作者
原帖由 awk就是awp加ak 于 2007-1-17 17:51 发表
对了,join 方法我原来是这么写的,主要是因为有问题没贴上:
  1. join -1 3 -2 1 -o 1.1,1.2,2.2,1.4,1.5 -a 1 -t'|' <( sort -t'|' -k3 A ) <( xargs -n2 < B |tr ' ' '|' )
复制代码


所以当时我想要是...join和awk一样支持正则表达式分隔符多好啊...^_^

论坛徽章:
0
15 [报告]
发表于 2007-01-17 18:01 |只看该作者
它只支持一个字符!
就算他支持正则分隔符,也只是解决了一部分问题,还不中。。-a 1 的功能还是弱,当 B 文件找不到的key的时候,-o 输出列表里面是空白。。
$ join -1 3 -2 1 -o 1.1,1.2,2.2,1.4,1.5 -a 1 -t'|' <( sort ii ) <( xargs -n2 < jj |tr ' ' '|' )
aaa|kkk|1|2|4
fffa|kfdsk|2|1|4
m|fdxvdsk||2|1
sd|fdfdsk||2|1
vc|1234||2|1
$ join -1 3 -2 1 -o 1.1,1.2,2.2,1.4,1.5 -a 1 -t'|' <( sort -t'|' -k3 ii ) <( xargs -n2 < jj |tr ' ' '|' )
vc|1234||2|1
sd|fdfdsk||2|1
m|fdxvdsk||2|1
fffa|kfdsk|2|1|4
aaa|kkk||2|4

论坛徽章:
0
16 [报告]
发表于 2007-01-17 18:04 |只看该作者
原帖由 awk就是awp加ak 于 2007-1-17 18:01 发表
它只支持一个字符!
就算他支持正则分隔符,也只是解决了一部分问题,还不中。。-a 1 的功能还是弱,当 B 文件找不到的key的时候,-o 输出列表里面是空白。。



不过指定要连接的每个文件使用的分隔符, 还是比较现实的, 至于排序之类的...倒可以不理会.
另外之所以输出空白多多少少就是和数据库里面表的外连接内连接对应。

论坛徽章:
0
17 [报告]
发表于 2007-01-17 18:11 |只看该作者
分隔符的话,还可以通过其他方法处理。。但是这空白咋整?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP