免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6845 | 回复: 1

多个文件(超过1000个)区间合并怎么弄啊 [复制链接]

论坛徽章:
0
发表于 2019-07-26 18:48 |显示全部楼层
本帖最后由 shuiwei 于 2019-07-26 23:50 编辑

问题描述:有1000多个格式同样的文件(以test.txt和test1.txt为例),如果第一列相同,则看第二列和第三列是否重叠(若重叠两端取最小值和最大值),最后输出文件包括合并以后的区间、以及每个文件在每个区间存在与否(存在记为1,不存在记为0),输出结果以out.txt为例。perl小白,拜托各路大神了!
test.txt
chr1    3       5
chr1    22      55
chr2    123     179
chr3    3       7
chr3    5       7

test1.txt
chr1    4       10
chr2    5       124
chr2    333     444
chr3    5       12
chr3    53      64

out.txt
chr     start   end     test    test1
chr1    3       10      1       1
chr1    22      55      1       0
chr2    5       179     1       1
chr2    333     444     0       1
chr3    3       12      1       1
chr3    53      64      0       1

论坛徽章:
0
发表于 2019-08-19 12:16 |显示全部楼层
你这示例和你说的不一样啊
第二行的第一列都不相同
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会 限时8.5折

【架构革新 高效可控】2020年8月17日~19日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP