免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
打印 上一主题 下一主题

perl 引号 [复制链接]

论坛徽章:
0
21 [报告]
发表于 2015-08-13 11:44 |只看该作者
  1. AT1G07550.1     | Symbols:  | Leucine-rich repeat protein kinase family protein | chr1:2322709-2326512 REVERSE LENGTH=864
  2. KVVELAMSCVNRTSKERPNMSQVVHVLNECLETCEKWRKSQEVDLSSPLELSIVVDTEINPKARIVDPNLHQDYDTSSAW

  3. --------------------- WARNING ---------------------
  4. ,SG: sequence '1' doesn't validate, mismatch is
  5. ---------------------------------------------------

  6. ------------- EXCEPTION -------------
  7. ] which does not look healthyCLETCEKWRKSQEVDLSSPLELSIVVDTEINPKARIVDPNLHQDYDTSSAWASNESPYNEANSNLTYISDADFIQGGKTGNVQKDLLMKLRKPYT
  8. STACK Bio::PrimarySeq::seq /usr/lib64/perl5/vendor_perl/5.16.0/Bio/PrimarySeq.pm:285
  9. STACK Bio::PrimarySeq::new /usr/lib64/perl5/vendor_perl/5.16.0/Bio/PrimarySeq.pm:239
  10. STACK Bio::Seq::new /usr/lib64/perl5/vendor_perl/5.16.0/Bio/Seq.pm:497
  11. STACK toplevel delete_double_qw.pl:18
  12. -------------------------------------
  13. 完全复制粘贴
复制代码
回复 18# 一串儿葡萄皮


   

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
22 [报告]
发表于 2015-08-13 12:27 |只看该作者
b114213903 发表于 2015-08-12 19:54
我这运行正常,不知道什么原因


估计是输入文件不一样吧

论坛徽章:
7
巳蛇
日期:2013-11-28 09:22:59天秤座
日期:2014-10-25 15:40:452015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:53:172015亚冠之德黑兰石油
日期:2015-07-15 08:46:452015亚冠之平阳省
日期:2015-11-08 16:27:53白银圣斗士
日期:2015-11-14 09:58:12
23 [报告]
发表于 2015-08-13 12:49 |只看该作者
回复 22# MMMIX



   

论坛徽章:
7
巳蛇
日期:2013-11-28 09:22:59天秤座
日期:2014-10-25 15:40:452015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:53:172015亚冠之德黑兰石油
日期:2015-07-15 08:46:452015亚冠之平阳省
日期:2015-11-08 16:27:53白银圣斗士
日期:2015-11-14 09:58:12
24 [报告]
发表于 2015-08-13 12:50 |只看该作者
本帖最后由 b114213903 于 2015-08-13 13:06 编辑

回复 21# 一串儿葡萄皮


    应该是你的氨基酸序列中存在非氨基酸字符。请仔细检查!
  1. #!/usr/bin/perl
  2. use strict;
  3. use Bio::SeqIO;
  4. use Bio::Seq;

  5. my $fasta=shift @ARGV;
  6. (my $Out=$fasta)=~s/(\.[^\.]+)$/_out$1/;

  7. open (IN,"<$fasta") or die "Open $fasta failed!\n";
  8. my $Out=Bio::SeqIO->new(-file=>">$Out",-format=>'fasta');

  9. my ($flag,$seq,$id,$desc)=();
  10. while(my $line=<IN>){
  11.         chomp($line);
  12.         if($line=~/\>/){
  13.                 if($flag){
  14.                         print "$id\t$desc\n$seq\n";
  15.                                                 $seq=~s/[^ABCDEFGHIKLMNPQRSTVWXYZ]/X/gi;        #把非氨基酸字符转换为未知序列
  16.                         my $SEQ_OBJ=Bio::Seq->new(-seq=>$seq,-id=>$id,-desc=>$desc,-alphabet=>'protein');
  17.                         $Out->write_seq($SEQ_OBJ);
  18.                 }
  19.                 $line=~s/[\"\>]//g;
  20.                 ($id,$desc)=split (/\s+/,$line,2);
  21.                 $seq=undef;
  22.                 $flag=1;
  23.         }else{
  24.                 $seq.=$line;
  25.         }
  26. }
  27. print "$id\t$desc\n$seq\n";
  28. $seq=~s/[^ABCDEFGHIKLMNPQRSTVWXYZ]/X/gi;        #把非氨基酸字符转换为未知序列
  29. my $SEQ_OBJ=Bio::Seq->new(-seq=>$seq,-id=>$id,-desc=>$desc,-alphabet=>'protein');
  30. $Out->write_seq($SEQ_OBJ);

  31. $Out->close();
复制代码
试试这个转换以后可不可以

论坛徽章:
0
25 [报告]
发表于 2015-08-14 14:39 |只看该作者
可以了,O(∩_∩)O谢谢。我想问一下学perl做生物信息需要看什么样的书,总感觉不知道从哪儿入手。 回复 24# b114213903


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP