免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
论坛 程序设计 Perl 已解决
最近访问板块 发新帖
查看: 3047 | 回复: 6
打印 上一主题 下一主题

已解决 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-08-04 15:19 |只看该作者 |倒序浏览
本帖最后由 papagogogo 于 2014-08-05 13:58 编辑

多谢各位多谢各位多谢各位多谢各位

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
2 [报告]
发表于 2014-08-04 15:45 |只看该作者
回复 1# papagogogo


    这样可以吗?
  1. #! /usr/bin/perl -w
  2. # File Name: pa.pl
  3. %hash;
  4. while (<>) {
  5.     chomp;
  6.     my $l = <>;
  7.     chomp $l;
  8.     $hash{$_}.=$l;
  9. }
  10. for $key (sort keys %hash){
  11.         print "$key\t$hash{$key}\n";
  12. }

  13. --------------------------------------
  14. perl pa.pl hh
  15. A       ATGATAGATAGCTCGCTCTAGCTAGCATCAGATCAGCATCAGCCGATGCTAGCTAGCTAGTCGATGCTAGCTAGTAGTCGATGCTAGCTAGCTGTACGTGCATGATC
  16. B       CAGCATGATCGATGCTAGTCAGTGCGA
  17. C       CATGCATGCTAGCTAGCTGATGCTAGCTGAGTAGCTAAGTCATCGATACGATCGATGCA
  18. D       AGCTGCTAGCTGCTAGTCAGTCGCAGTAGT
复制代码

论坛徽章:
0
3 [报告]
发表于 2014-08-04 16:09 |只看该作者
谢谢你,验证了一下有的对有的好像有点问题,我调试一下。我看看你的代码。谢谢你哦
回复 2# huang6894


   

论坛徽章:
0
4 [报告]
发表于 2014-08-04 17:34 |只看该作者
还想请问一下,如果我继续想将得到的序列翻译成氨基酸。那么我是不是得用substr按3个3个分开,然后建hash?请问如何让hash匹配呢。谢谢。
回复 2# huang6894


   

论坛徽章:
1
羊年新春福章
日期:2015-04-28 20:40:58
5 [报告]
发表于 2014-08-04 20:24 |只看该作者
#!/usr/bin/perl -w
use strict;
my %hash;
my $i=3;
my $k;
while (<DATA>)
{
chomp;
        if($i%2)
        {
        $k=$_;
         $i++;
        }
        else
        {
        my $v=$_;
        push @{$hash{$k}},$v ;
        $i++;
        }
}
foreach my $k (keys %hash)
{
print "$k\n";
my @seq=@{$hash{$k}};
print @seq;
print "\n";
}



__DATA__
A
ATGATAGATAGCTCGCTCTAGCTAGCATCAGATCAGCATCAGC
A
CGATGCTAGCTAGCTAGTCGATGCTAGCTAGTAGT
A
CGATGCTAGCTAGCTGTACGTGCATGATC
B
CAGCATGATCGATGCTAGTCAGTGCGA
C
CATGCATGCTAGCTAGCTGATGCTAGCTGA
C
GTAGCTAAGTCATCGATACGATCGATGCA
D
AGCTGCTAGCTGCTAGTCAGTCGCAGTAGT


OUT

A
ATGATAGATAGCTCGCTCTAGCTAGCATCAGATCAGCATCAGCCGATGCTAGCTAGCTAGTCGATGCTAGCTAGTAGTCGATGCTAGCTAGCTGTACGTGCATGATC
D
AGCTGCTAGCTGCTAGTCAGTCGCAGTAGT
C
CATGCATGCTAGCTAGCTGATGCTAGCTGAGTAGCTAAGTCATCGATACGATCGATGCA
B
CAGCATGATCGATGCTAGTCAGTGCGA

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
6 [报告]
发表于 2014-08-04 21:09 |只看该作者
回复 4# papagogogo


    除了bioperl现成的包外,你可以把密码子存成一个hash,如:
my %code = (
    'TCA' => 'S',    # Serine
    'TTC' => 'F',    # Phenylalanine
    'TTT' => 'F',    # Phenylalanine
.....
)
然后把你的序列每三个在hash中查找是否有对应value
如:
my $aa;
while ( $Seq =~ /([ATCG]{3})/g ) { #正则捕获
        $aa .= $code{$1} || " ";
}

想起好像之前也问过@pitonas大神相关的问题~呵呵

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
7 [报告]
发表于 2014-08-04 21:22 |只看该作者
这样可以吗 ~ {:2_172:}
翻译成1 条 氨基酸
  1. #!/usr/bin/perl

  2. my %TR = qw[
  3.   AAA  K  AAC  N  AAG  K  AAT  N  ACA  T  ACC  T  ACG  T  ACT  T
  4.   AGA  R  AGC  S  AGG  R  AGT  S  ATA  I  ATC  I  ATG  M  ATT  I
  5.   CAA  Q  CAC  H  CAG  Q  CAT  H  CCA  P  CCC  P  CCG  P  CCT  P
  6.   CGA  R  CGC  R  CGG  R  CGT  R  CTA  L  CTC  L  CTG  L  CTT  L
  7.   GAA  E  GAC  D  GAG  E  GAT  D  GCA  A  GCC  A  GCG  A  GCT  A
  8.   GGA  G  GGC  G  GGG  G  GGT  G  GTA  V  GTC  V  GTG  V  GTT  V
  9.   TAA  _  TAC  Y  TAG  _  TAT  Y  TCA  S  TCC  S  TCG  S  TCT  S
  10.   TGA  _  TGC  C  TGG  W  TGT  C  TTA  L  TTC  F  TTG  L  TTT  F
  11. ];

  12. my %h;

  13. until (eof) {
  14.     my ( $key, $seq ) = ( ~~<DATA>, ~~<DATA> );
  15.     chomp( $key, $seq );
  16.     $h{$key} .= $seq;
  17. }

  18. for my $key ( sort keys %h ) {
  19.     my @dna = unpack '(A3)*', $h{$key};
  20.     pop @dna if length( $dna[-1] ) != 3;
  21.     print "$key\n", @TR{@dna}, $/;
  22. }

  23. __DATA__
  24. A
  25. ATGATAGATAGCTCGCTCTAGCTAGCATCAGATCAGCATCAGC
  26. A
  27. CGATGCTAGCTAGCTAGTCGATGCTAGCTAGTAGT
  28. A
  29. CGATGCTAGCTAGCTGTACGTGCATGATC
  30. B
  31. CAGCATGATCGATGCTAGTCAGTGCGA
  32. C
  33. CATGCATGCTAGCTAGCTGATGCTAGCTGA
  34. C
  35. GTAGCTAAGTCATCGATACGATCGATGCA
  36. D
  37. AGCTGCTAGCTGCTAGTCAGTCGCAGTAGT
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP