免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
论坛 程序设计 Perl 求助
最近访问板块 发新帖
查看: 1351 | 回复: 7
打印 上一主题 下一主题

求助 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-07-08 16:31 |只看该作者 |倒序浏览
我有如下格式的文件:
LOC_Os01g01019\tGO:0016023
LOC_Os01g01019\tGO:0009536
LOC_Os01g01010\tGO:0005622
LOC_Os01g01011\tGO:0005622

第一列是基因ID  第二列是GO term,会出现同一基因ID对应不用GO term的情况,也会出不同基因ID对应同一GO term的情况

我的目的是做成以下格式的文件:
LOC_Os01g01019\tGO:0016023\tGO:0009536
LOC_Os01g01010\tGO:0005622
LOC_Os01g01011\tGO:0005622

我是新手,不是很懂写perl脚本。求完整版代码。

论坛徽章:
2
CU大牛徽章
日期:2013-04-17 11:46:28CU大牛徽章
日期:2013-04-17 11:46:39
2 [报告]
发表于 2012-07-08 17:13 |只看该作者
  1. #!/usr/bin/env perl
  2. do { if (/^(.*)\\t(.*)$/) { push @{$hash{$1}}, $2; } } for (<DATA>);
  3. while (($k, $v) = each %hash) {
  4.     print $k . '\t' . join('\t', @{$v}) . "\n";
  5. }
  6. __DATA__
  7. LOC_Os01g01019\tGO:0016023
  8. LOC_Os01g01019\tGO:0009536
  9. LOC_Os01g01010\tGO:0005622
  10. LOC_Os01g01011\tGO:0005622
复制代码

论坛徽章:
0
3 [报告]
发表于 2012-07-08 23:13 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. use Bio::SeqIO;

  5. my %id;
  6. open my $fh, "<", 'f1.txt' or die $!;

  7. while (<$fh>) {
  8.    chomp;
  9.    my $id = substr $_, 1;
  10.    $id{$id}++;
  11. }
  12. close $fh or die $!;

  13. my $in  = Bio::SeqIO->new ( -file   => "f2.txt",
  14.                            -format => 'fasta');
  15. my $out = Bio::SeqIO->new(  -file   => '>fasta.dat',
  16.                            -format => 'fasta');

  17. while(my $seq = $in->next_seq() ) {
  18.    $out->write_seq($seq) if exists $id{$seq->id};
  19. }
复制代码

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
4 [报告]
发表于 2012-07-09 09:47 来自手机 |只看该作者
你在做基因注释吗?

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
5 [报告]
发表于 2012-07-09 09:48 来自手机 |只看该作者
你在做基因注释?

论坛徽章:
0
6 [报告]
发表于 2012-07-09 15:38 |只看该作者
#!D:\strawberry\perl\bin\perl5.12.3 -w

open FILE,"D:/cc/cc1.txt" or die "$!";

while (<FILE>)
{
    my ( $x, $y ) = split /\\t/;
    if(exists $hash{$x})
    {
            $hash{$x}=$hash{$x}."\\t".$y;
            chomp($hash{$x});
    }else
    {
            $hash{$x}=$y;
            chomp($hash{$x});
    }
}

while((my $k,my $v)=each %hash)
{
  print $k."\\t".$v,"\n";
}
close FILE;

论坛徽章:
0
7 [报告]
发表于 2012-07-09 19:13 |只看该作者
回复 4# fly_in_thesky


    是的 我看一下基因的GO注释情况

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
8 [报告]
发表于 2012-07-09 19:25 |只看该作者
回复 7# 那只猴子


    难不成是同行?你用的在线注释?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP