免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1387 | 回复: 5

跨文件匹配关键字 [复制链接]

论坛徽章:
0
发表于 2012-05-23 20:25 |显示全部楼层
   未解决。。

当两个不同文件中(输入文件一,第二列与输入文件二,第三列)存在关键字需要匹配,且按此合并匹配成功的记录时,如何匹配
  1. 输入文件一:
  2. 1        aa        123
  3. 2        aa        234
  4. 3        bb        345
  5. 4        bb        445
  6. 5        dd        234
复制代码
  1. 输入文件二:
  2. A1        111        aa
  3. B1        222        bb
  4. B2        333        bb
  5. B2        333        cc
复制代码
根据输入文件一中第2列,输入文件二中第3列作为关键字进行匹配,输出全部匹配的记录
期望输出结果:
  1. 1        aa        123        A1        111        aa
  2. 2        aa        234        A1        111        aa
  3. 3        bb        345        B1        222        bb
  4. 4        bb        445        B1        222        bb
  5. 3        bb        345        B2        333        bb
  6. 4        bb        445        B2        333        bb
复制代码
自己匹配的结果总是只输出部分的结果,即只能识别一个输入文件中重复的关键字,当两个输入文件中关键字均重复出现时,则会忽略一些记录

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
发表于 2012-05-23 20:54 |显示全部楼层
如果可能出现多个那显然不能简单的用 hash 解决,用 hash of array。比如第一个 bb 里面有两个元素,第二个 bb 里面有两个,再做组合。

论坛徽章:
0
发表于 2012-05-23 22:34 |显示全部楼层
awk is fit for this issue

论坛徽章:
0
发表于 2012-05-23 22:36 |显示全部楼层
回复 3# judite


    关键是我shell也不太熟练,仍然只能输出部分结果,而不是全部

论坛徽章:
0
发表于 2012-05-25 08:30 |显示全部楼层
我觉得用perl实现也不难啊
把文件一读到数组a;文件二读到数组b
嵌套循环比较a[1]和b[2]
打印输出

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
发表于 2012-05-25 10:24 |显示全部楼层
就是两个for循环的问题吧。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP