1 23 / 3 页

21楼 [报告]

发表于 2015-08-13 11:44 |只看该作者

AT1G07550.1 | Symbols: | Leucine-rich repeat protein kinase family protein | chr1:2322709-2326512 REVERSE LENGTH=864
KVVELAMSCVNRTSKERPNMSQVVHVLNECLETCEKWRKSQEVDLSSPLELSIVVDTEINPKARIVDPNLHQDYDTSSAW
--------------------- WARNING ---------------------
,SG: sequence '1' doesn't validate, mismatch is
---------------------------------------------------
------------- EXCEPTION -------------
] which does not look healthyCLETCEKWRKSQEVDLSSPLELSIVVDTEINPKARIVDPNLHQDYDTSSAWASNESPYNEANSNLTYISDADFIQGGKTGNVQKDLLMKLRKPYT
STACK Bio::PrimarySeq::seq /usr/lib64/perl5/vendor_perl/5.16.0/Bio/PrimarySeq.pm:285
STACK Bio::PrimarySeq::new /usr/lib64/perl5/vendor_perl/5.16.0/Bio/PrimarySeq.pm:239
STACK Bio::Seq::new /usr/lib64/perl5/vendor_perl/5.16.0/Bio/Seq.pm:497
STACK toplevel delete_double_qw.pl:18
-------------------------------------
完全复制粘贴

复制代码

回复 18# 一串儿葡萄皮

22楼 [报告]

发表于 2015-08-13 12:27 |只看该作者

b114213903 发表于 2015-08-12 19:54
我这运行正常，不知道什么原因

估计是输入文件不一样吧

23楼 [报告]

发表于 2015-08-13 12:49 |只看该作者

回复 22# MMMIX

24楼 [报告]

发表于 2015-08-13 12:50 |只看该作者

本帖最后由 b114213903 于 2015-08-13 13:06 编辑

回复 21# 一串儿葡萄皮

应该是你的氨基酸序列中存在非氨基酸字符。请仔细检查！

#!/usr/bin/perl
use strict;
use Bio::SeqIO;
use Bio::Seq;
my $fasta=shift @ARGV;
(my $Out=$fasta)=~s/(\.[^\.]+)$/_out$1/;
open (IN,"<$fasta") or die "Open $fasta failed!\n";
my $Out=Bio::SeqIO->new(-file=>">$Out",-format=>'fasta');
my ($flag,$seq,$id,$desc)=();
while(my $line=<IN>){
chomp($line);
if($line=~/\>/){
if($flag){
print "$id\t$desc\n$seq\n";
$seq=~s/[^ABCDEFGHIKLMNPQRSTVWXYZ]/X/gi; #把非氨基酸字符转换为未知序列
my $SEQ_OBJ=Bio::Seq->new(-seq=>$seq,-id=>$id,-desc=>$desc,-alphabet=>'protein');
$Out->write_seq($SEQ_OBJ);
}
$line=~s/[\"\>]//g;
($id,$desc)=split (/\s+/,$line,2);
$seq=undef;
$flag=1;
}else{
$seq.=$line;
}
}
print "$id\t$desc\n$seq\n";
$seq=~s/[^ABCDEFGHIKLMNPQRSTVWXYZ]/X/gi; #把非氨基酸字符转换为未知序列
my $SEQ_OBJ=Bio::Seq->new(-seq=>$seq,-id=>$id,-desc=>$desc,-alphabet=>'protein');
$Out->write_seq($SEQ_OBJ);
$Out->close();