免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: huang6894
打印 上一主题 下一主题

【问题】对区间匹配计算 [复制链接]

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
11 [报告]
发表于 2014-08-18 15:35 |只看该作者
回复 9# huang6894

大爷的,老是被你这些突然冒出来的莫名其妙的东西迷惑!
   

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
12 [报告]
发表于 2014-08-18 15:37 |只看该作者
回复 10# yestreenstars


    对。。。对不起。。。我不是故意的。。。

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
13 [报告]
发表于 2014-08-18 17:08 |只看该作者
如果中间断开了肿么办?比如这样的文本2:
  1. 16642     chr6    36238435 18      HOM     del
  2. 16642     chr6    36238437 17      HOM     del
  3. 16642     chr6    36238438 18      HOM     del
  4. 16642     chr6    36238440 17      HOM     del
  5. 16642     chr6    36238441 24      HOM     del
  6. 16642     chr6    36238442 24      HOM     del
  7. 16642     chr6    36238443 24      HOM     del
  8. 16642     chr6    36238444 24      HOM     del
  9. 16642     chr6    36238445 24      HOM     del
  10. 16642     chr6    36238446 24      HET     del
  11. 16642     chr6    3623844724      HET     del
  12. 16642     chrX    2336324 24      HET     del
  13. 16642     chrX    2336325 24      HOM     del
  14. 16642     chrX    2336326 24      HOM     del
  15. 16642     chrX    2336327 24      HOM     del
复制代码

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
14 [报告]
发表于 2014-08-18 17:15 |只看该作者
回复 12# yestreenstars


    谢谢大神。。只要该数字在区间内就算一次,最后获取得到对应的区间后,两个区间是相邻的合并,不相邻的不合并

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
15 [报告]
发表于 2014-08-18 17:17 |只看该作者
回复 13# huang6894

我提供的文本2得到的结果是怎样的?
   

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
16 [报告]
发表于 2014-08-18 17:39 |只看该作者
本帖最后由 huang6894 于 2014-08-18 17:40 编辑

回复 14# yestreenstars

  1. 16642     chr6    36238435 18      HOM     del 第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238435未落在任何区域,此时36238435上$h{chr6}{HOM}{del}的覆盖度为1
  2. 16642     chr6    36238437 17      HOM     del   第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238437落在CDS1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为1
  3. 16642     chr6    36238438 18      HOM     del  第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238438落在CDS1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为2
  4. 16642     chr6    36238440 17      HOM     del  第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238440落在CDS1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为3
  5. 16642     chr6    36238441 24      HOM     del  二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238441落在CDS1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为4
  6. 16642     chr6    36238442 24      HOM     del  第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238442落在intron1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为1
  7. 16642     chr6    36238443 24      HOM     del   第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238443落在intron1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为2
  8. 16642     chr6    36238444 24      HOM     del   第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238444落在intron1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为3
  9. 16642     chr6    36238445 24      HOM     del  第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238445落在intron1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为4
  10. 16642     chr6    36238446 24      HET     del  第二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238446落在intron1,此时CDS1上$h{chr6}{HOM}{del}覆盖度为1
  11. 16642     chr6    3623844724      HET     del  二列是chr6,排除掉文本1段落第一行第二列不是chr6的,然后36238447落在CDS2,此时CDS2上$h{chr6}{HOM}{del}覆盖度为1
  12. 16642     chrX    2336324 24      HET     del   二列是chrX,排除掉文本1段落第一行第二列不是chrX的,然后2336324落在5-UTR,此时5-UTR上$h{chrX}{HET}{del}覆盖度为1
  13. 16642     chrX    2336325 24      HOM     del  二列是chrX,排除掉文本1段落第一行第二列不是chrX的,然后2336325落在5-UTR,此时5-UTR上$h{chrX}{HET}{del}覆盖度为2
  14. 16642     chrX    2336326 24      HOM     del 二列是chrX,排除掉文本1段落第一行第二列不是chrX的,然后2336326落在5-UTR,此时5-UTR上$h{chrX}{HET}{del}覆盖度为3
  15. 16642     chrX    2336327 24      HOM     del  二列是chrX,排除掉文本1段落第一行第二列不是chrX的,然后2336327落在intron1,此时5-UTR上$h{chrX}{HET}{del}覆盖度为1
复制代码
-----------------------------------------------
chr6:
CDS1的长度为36238437-36238441 :5,$h{chr6}{HON}{del}覆盖度为4;4/5>66%,符合条件
intron1的长度36238442-36259446:5,$h{chr6}{HON}{del}覆盖度为4;4/5>66%,符号条件
考虑到CDS1和intron1是相邻的,合并之
所以输出6642     chr6    36238436-36238445     HOM     del  NM_001145717   PNPLA1 CDS1:intron1

chrX:
5-UTR:长度为2336324-2336326:3,覆盖度为3,3/3>66%,符合条件
intron1的长度:336327-2336329:3,覆盖度为1,1/3<66%,不符合条件

输出16642     chrX    2336325-2336326        HOM     del  NM_002364   MAGEB2  5-UTR

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
17 [报告]
发表于 2014-08-19 10:53 |只看该作者
intron1 36238442        36259446        .       205     206

这区间相差21004也是手误?

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
18 [报告]
发表于 2014-08-19 12:36 |只看该作者
回复 16# yestreenstars


    是的

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
19 [报告]
发表于 2014-08-19 12:38 |只看该作者
回复 17# yestreenstars


    感激涕零。。。我会好好研究的。。。。

------------------------
最近论坛怎么收不到提醒了?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP