免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1897 | 回复: 2

[文本处理] 如何根据A文件来获取C文件 [复制链接]

论坛徽章:
0
发表于 2018-03-22 22:23 |显示全部楼层
各位大神,我有这样两个文件:A文件是一列序列号,B文件是序列间blast的结果,我想在B文件筛选包含A文件中两两序列比对的所在行(如C文件)。
A文件:
C167813833
C168203577
C168604216
C168699028
C168744106
C168859662
C31411970
C31513142
C31549612
B文件:
C167813833 C31411970 234
C168604216 C31549612 136
C167813833 C16459662 56
C168744106 C31411970 784
C168456706 C168699028 123
C168346706 C168203577 251
C31443970 C31549612 765
C31549612 C168203577 879
C31311970 C168859662 564
C31513142 C168699028 254
C168859662 C31433142 241
C文件:
C167813833 C31411970 234
C168604216 C31549612 136
C168744106 C31411970 784
C31549612 C168203577 879
C31513142 C168699028 254

求大神帮忙,感激

论坛徽章:
0
发表于 2018-03-22 22:43 |显示全部楼层
# awk 'NR==FNR{a[$1]=$1; next} {if (a[$1]&&a[$2]) print}' 1 2
C167813833 C31411970 234
C168604216 C31549612 136
C168744106 C31411970 784
C31549612 C168203577 879
C31513142 C168699028 254

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
发表于 2018-03-23 11:30 |显示全部楼层
回复 1# 小小脑


  1. awk 'FILENAME==ARGV[1]{a[$0]++;next}a[$1]&&a[$2]{print>"C"}' A B
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP