免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
论坛 程序设计 Perl 求助
最近访问板块 发新帖
查看: 1472 | 回复: 2
打印 上一主题 下一主题

求助 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-03-16 09:27 |只看该作者 |倒序浏览
提取最后一对序列
如下序列
1_NC_003070I001CATTCAAGGCTTAAAAGACTTAAAGTAAACGTTCATTAGCTAAATCCAA
E012CACTATCTCCGTAACAAAATCGAAGGAAACACTAGCCGCGACGTTG
I001 63 AAAAAAAAACAAA 75 83
E012 153 AGAAAACAACAAA 165 200
13  47
I002CAAAAGAAGATAAGTATATATATATATATATATATACACCTATAT
E023TAAAAGGGTTTTGGTGTTCCTCGATGGAAGATACCCTGACAAAACCAAATCTGA
I002 151 ATGAGAGTGGTTACAAAATATGACTACTTGAATACACGAATG 192 210
E023 96 ATCAGAGGACATATGTCATCTGCAGACTTGAGTACAAGGGTG 137 200
42  57
2_NC_003070I001CATTCTAAAAACATAATTACCTAGAAGAAACTGGGTTAATCCCA
E012ATGCGGAAATTGCAAGGAAGTAGCAGATGAGTACATCGAGTGTGAACGCATG
I001 57 GATAATTTAAAGAAGTTTCAAAGG 80 107
E012 6 GAAATTGCAAGGAAGTAGCAGATG 29 52
24  39
I002CAGACAAAATTAGTGAAAGAAAGGGAAAAACCCACAAAGGGA
E023GGAAATTGCAAGGAAGTAGCAGATGAGTACATCGAGTGTGAACGCATGAT
I002 35 CAAAGGGATAAAGAAAGGT 53 92
E023 80 CAAAGGTATATAGACACGT 98 138
19  59
I003CATTTTTTGATAAAGTTAAGTTCAAGAACTAAAGTTCGTAACGATCAAGGACAG
E034CAATATTCAGCATCTGTTGTGGAAGTTGGTCTTCGCCTATCTTCTTCTAGACTGTT
I003 1 CATTTTTTGATAAAGTT 17 249
E034 11 CATCTGTTGTGGAAGTT 27 56
17  40
要求:把上各个基因名下的最后一个对匹配序列取出来(就是红色的部分)。
结果如下
1_NC_003070
I002 151 ATGAGAGTGGTTACAAAATATGACTACTTGAATACACGAATG 192 210
E023 96 ATCAGAGGACATATGTCATCTGCAGACTTGAGTACAAGGGTG 137 200
2_NC_003070
I003 1 CATTTTTTGATAAAGTT 17 249
E034 11 CATCTGTTGTGGAAGTT 27 56

论坛徽章:
0
2 [报告]
发表于 2013-03-16 09:33 |只看该作者
提取最后一对序列
如下序列
1_NC_003070
I001CATTCAAGGCTTAAAAGACTTAAAGTAAACGTTCATTAGCTAAATCCAA
E012CACTATCTCCGTAACAAAATCGAAGGAAACACTAGCCGCGACGTTG
I001 63 AAAAAAAAACAAA 75 83
E012 153 AGAAAACAACAAA 165 200

13  47
I002CAAAAGAAGATAAGTATATATATATATATATATATACACCTATAT
E023TAAAAGGGTTTTGGTGTTCCTCGATGGAAGATACCCTGACAAAACCAAATCTGA
I002 151 ATGAGAGTGGTTACAAAATATGACTACTTGAATACACGAATG 192 210
E023 96 ATCAGAGGACATATGTCATCTGCAGACTTGAGTACAAGGGTG 137 200
42  57
2_NC_003070
I001CATTCTAAAAACATAATTACCTAGAAGAAACTGGGTTAATCCCA
E012ATGCGGAAATTGCAAGGAAGTAGCAGATGAGTACATCGAGTGTGAACGCATG
I001 57 GATAATTTAAAGAAGTTTCAAAGG 80 107
E012 6 GAAATTGCAAGGAAGTAGCAGATG 29 52
24  39
I002CAGACAAAATTAGTGAAAGAAAGGGAAAAACCCACAAAGGGA
E023GGAAATTGCAAGGAAGTAGCAGATGAGTACATCGAGTGTGAACGCATGAT
I002 35 CAAAGGGATAAAGAAAGGT 53 92
E023 80 CAAAGGTATATAGACACGT 98 138
19  59
I003CATTTTTTGATAAAGTTAAGTTCAAGAACTAAAGTTCGTAACGATCAAGGACAG
E034CAATATTCAGCATCTGTTGTGGAAGTTGGTCTTCGCCTATCTTCTTCTAGACTGTT
I003 1 CATTTTTTGATAAAGTT 17 249
E034 11 CATCTGTTGTGGAAGTT 27 56

17  40
要求:把上各个基因名下的最后一个对匹配序列取出来(就是红色的部分)。
结果如下
1_NC_003070
I002 151 ATGAGAGTGGTTACAAAATATGACTACTTGAATACACGAATG 192 210
E023 96 ATCAGAGGACATATGTCATCTGCAGACTTGAGTACAAGGGTG 137 200
2_NC_003070
I003 1 CATTTTTTGATAAAGTT 17 249
E034 11 CATCTGTTGTGGAAGTT 27 56

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
3 [报告]
发表于 2013-03-16 10:46 |只看该作者
本帖最后由 rubyish 于 2013-03-16 06:48 编辑
  1. #!/usr/bin/perl
  2. use 5.016;

  3. say for map {(split /\n/)[0, -3, -2]} split /(?=\d+_.*?\n)/, do {local $/; <DATA>};

  4. __DATA__
  5. 1_NC_003070
  6. I001CATTCAAGGCTTAAAAGACTTAAAGTAAACGTTCATTAGCTAAATCCAA
  7. E012CACTATCTCCGTAACAAAATCGAAGGAAACACTAGCCGCGACGTTG
  8. I001 63 AAAAAAAAACAAA 75 83
  9. E012 153 AGAAAACAACAAA 165 200
  10. 13  47
  11. I002CAAAAGAAGATAAGTATATATATATATATATATATACACCTATAT
  12. E023TAAAAGGGTTTTGGTGTTCCTCGATGGAAGATACCCTGACAAAACCAAATCTGA
  13. I002 151 ATGAGAGTGGTTACAAAATATGACTACTTGAATACACGAATG 192 210
  14. E023 96 ATCAGAGGACATATGTCATCTGCAGACTTGAGTACAAGGGTG 137 200
  15. 42  57
  16. 2_NC_003070
  17. I001CATTCTAAAAACATAATTACCTAGAAGAAACTGGGTTAATCCCA
  18. E012ATGCGGAAATTGCAAGGAAGTAGCAGATGAGTACATCGAGTGTGAACGCATG
  19. I001 57 GATAATTTAAAGAAGTTTCAAAGG 80 107
  20. E012 6 GAAATTGCAAGGAAGTAGCAGATG 29 52
  21. 24  39
  22. I002CAGACAAAATTAGTGAAAGAAAGGGAAAAACCCACAAAGGGA
  23. E023GGAAATTGCAAGGAAGTAGCAGATGAGTACATCGAGTGTGAACGCATGAT
  24. I002 35 CAAAGGGATAAAGAAAGGT 53 92
  25. E023 80 CAAAGGTATATAGACACGT 98 138
  26. 19  59
  27. I003CATTTTTTGATAAAGTTAAGTTCAAGAACTAAAGTTCGTAACGATCAAGGACAG
  28. E034CAATATTCAGCATCTGTTGTGGAAGTTGGTCTTCGCCTATCTTCTTCTAGACTGTT
  29. I003 1 CATTTTTTGATAAAGTT 17 249
  30. E034 11 CATCTGTTGTGGAAGTT 27 56
  31. 19  59
复制代码
  1. 1_NC_003070
  2. I002 151 ATGAGAGTGGTTACAAAATATGACTACTTGAATACACGAATG 192 210
  3. E023 96 ATCAGAGGACATATGTCATCTGCAGACTTGAGTACAAGGGTG 137 200
  4. 2_NC_003070
  5. I003 1 CATTTTTTGATAAAGTT 17 249
  6. E034 11 CATCTGTTGTGGAAGTT 27 56
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP