免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234
最近访问板块 发新帖
打印 上一主题 下一主题

跪求高手帮助解决perl问题 [复制链接]

论坛徽章:
7
巳蛇
日期:2013-11-28 09:22:59天秤座
日期:2014-10-25 15:40:452015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:53:172015亚冠之德黑兰石油
日期:2015-07-15 08:46:452015亚冠之平阳省
日期:2015-11-08 16:27:53白银圣斗士
日期:2015-11-14 09:58:12
31 [报告]
发表于 2014-12-16 15:32 |只看该作者
回复 30# chenhao392


    因为我看到他“orthol-msu.txt”文件里的ID都没“.”,就直接用了/^(\w+)/,呵呵

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-10-07 06:20:00
32 [报告]
发表于 2014-12-17 07:39 |只看该作者
用于多个isoform的code
那个ID的问题 fix了
  1. #!/usr/bin/perl

  2. use strict;
  3. use warnings;

  4. my %id;
  5. my %seq;

  6. #load orthoMCL result from MSU
  7. open FILE, "<$ARGV[0]" or die "$!\n";
  8. while(<FILE>){
  9.     chomp;
  10.     #skip header line
  11.     if($. == 1){
  12.         next;
  13.     }

  14.     #get ortholog groups
  15.     my ($orthoID,undef,$speciesCount,@line)=split(/\s+/,$_);
  16.     for(my $i=$speciesCount;$i<scalar(@line);$i++){
  17.         $id{$orthoID}{$line[$i]}="";
  18.         $seq{$line[$i]}="";
  19.     }

  20. }
  21. close FILE;


  22. #scanning through the seq
  23. my $switch=0;
  24. my $id="";
  25. my $isoformID;
  26. open FILE, "<$ARGV[1]" or die "$!\n";
  27. while(<FILE>){
  28.     chomp;
  29.     chop;
  30.     if($_ =~ />([\w\.]+)/){
  31.         $switch =0;
  32.         $id=$1;
  33.         $isoformID=$id;
  34.         $id=~s/(.{4,})[\._].*/$1/;
  35.         if(defined $seq{$id}){
  36.             $switch = 1;
  37.             $seq{$id}.=">$isoformID\n";
  38.         }
  39.     }
  40.     elsif($_ =~ /^[ATCGatcg]/ && $switch == 1){
  41.         $seq{$id}.="$_\n";
  42.     }

  43. }
  44. close FILE;

  45. foreach my $orthoID(keys %id){
  46.     open OUT, ">$orthoID.fa" or die "$!\n";
  47.     foreach my $id(keys %{$id{$orthoID}}){
  48.         print OUT "$seq{$id}";
  49.     }
  50.     close OUT;
  51. }
复制代码

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-10-07 06:20:00
33 [报告]
发表于 2014-12-17 07:52 |只看该作者
回复 31# b114213903


    囧..
    然后,你怎么知道Orthologs-msu.txt 可以先按 \t 切,再按 \s+ 切?
    我这里的测试数据,貌似找不到\t , 我按\s+ 切了.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP