免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3117 | 回复: 4
打印 上一主题 下一主题

[文本处理] 去除相互重叠数据 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2020-01-03 13:24 |只看该作者 |倒序浏览
各位大神好,我这里有一个文件是基因组的位置信息,现在想要去重,想要求助。文件格式如下:chr      position1  position2   name   pvalue

chr1    100    120    peak1   0.001
chr1     98      105   peak2   0.0001
chr1     115    139   peak3    0.004
chr1     120    140   peak4    0.01
chr1      34     55     peak5    0.002

去重规则为:首先按照pvalue 从显著到不显著排序,然后从第一个最显著的peak开始,只要后边有和他overlap的peak则把后边的peak丢弃。然后再看第二显著的peak,同理后边如果有overlap的则丢弃。

以此类推,最后得到,互斥的一组peak.
请问可以实现吗?谢谢大家

论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
2 [报告]
发表于 2020-01-04 10:08 |只看该作者
可以实现。

论坛徽章:
0
3 [报告]
发表于 2020-01-06 09:08 |只看该作者
回复 2# cfwyy

可以拜托帮忙写一下吗 谢谢

论坛徽章:
10
15-16赛季CBA联赛之同曦
日期:2016-06-11 19:22:4115-16赛季CBA联赛之深圳
日期:2020-05-31 16:13:5615-16赛季CBA联赛之同曦
日期:2020-01-28 12:42:47每日论坛发贴之星
日期:2016-08-09 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00每日论坛发贴之星
日期:2016-07-12 06:20:00程序设计版块每日发帖之星
日期:2016-07-12 06:20:00程序设计版块每日发帖之星
日期:2016-07-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-04 06:20:0015-16赛季CBA联赛之佛山
日期:2021-02-26 09:33:41
4 [报告]
发表于 2020-01-27 21:08 |只看该作者
在另一个贴已解决【已解决】
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP