perl 引号 [复制链接]

论坛徽章:: 0

11楼 [报告]

发表于 2015-08-12 11:14 |只看该作者

部分文件
>Srcc10g063050.1.1 Receptor-like kinase Try_threonine protein kinase
MKTKHKLTPRPFTPTPSPTHIMGILLICFIFSITNSFVIAQDDAVPAKSFPVFTPEDNFL
IDCGATSSITLPGNKAFQPDQNTAKYLSYTGKDIQACASDKINVPSTLYVNAKIFTTEAI
YTFHASTSGLHWIRLHFFPFKYEEYDLK
">Solyc11g072930.1.1 LRR receptor-like serine_threonine-protein kinase, RLP"
MASSYFLLLVLVLSVFSVSADVFVSLDCGSSEAYTDHETSIDWLGDVDYVANGESHVVPS
NNSISHVSALEVRGLDSTMYSHVDDNSSDPPRITALYLSKFNLSGSLPDFSSMDAL
ETIDLSNNNLDGPIPDFFGTLPNLKELNLANNKFSGPVPASLSNKNGLTLDTSGNSDLCS
SSEESCQNNDSSSPGNDQPTTGSTNNNKKKKKKKNNLPIILGTTISAFLLLWAIVGIFAI
LHYKNKRAATSLINPGQASGGSTPFVDRVQMSEKIEKNPEVTAHDHENSTNV
">Solyc12g00890.1.1 Kinesin IPR001752 Kinesin, motor region"
ESVINGRDLLGFSLTSPDLVICTGSPDIPARNYGDSPEFLKGCSISLENGI
KGSEEVQAATKLFTDWQGSKDDDLCAPADFELPSPPVEENSSELSVPIVSINVGSTDCIS
SESGIQFSEDKYFCGGNVLSTDTRIEESICASVYQTARVGNFSYHFNNLSAGFYLVDLHF
VEVVLTDGSTGDFSENSPQRNSLEVNGDIKAAGKLQLANVSREK

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

MMMIX

广告杀手

论坛徽章:: 95

12楼 [报告]

发表于 2015-08-12 13:10 |只看该作者

本帖最后由 MMMIX 于 2015-08-12 13:13 编辑

一串儿葡萄皮发表于 2015-08-12 11:09
while(<W>){
chomp;
my$i='"\w+"';
$i=~s/\"//g;

}

你这就是个空循环, 除了把 W 读了一遍之外, 啥用都没有.

另外, 你把 my $i 写成 my$i 自己看着不糟心么? 多输入个空格是能累着你咋滴?

BTW again, 这都不是代码风格问题, 你这完全是审美观病变坏死的征兆!!!

评分

参与人数 1	信誉积分 +10	收起理由
substr函数	+ 10	赞一个! 多输入个空格是能累着你咋滴?

查看全部评分

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

MMMIX

广告杀手

论坛徽章:: 95

13楼 [报告]

发表于 2015-08-12 13:16 |只看该作者

一串儿葡萄皮发表于 2015-08-12 11:09
#!/usr/bin/perl -w
use warnings;

这两句完全就是不求甚解的范例: -w 和 use warnings; 的功能是重复的.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

b114213903

丰衣足食

论坛徽章:: 7

14楼 [报告]

发表于 2015-08-12 13:25 |只看该作者

回复 10# 一串儿葡萄皮

我已经在二楼给你提醒过了，ID行有引号的，不是标准的FASTA格式，BioPerl模块不能识别！

>Srcc10g063050.1.1 Receptor-like kinase Try_threonine protein kinase
MKTKHKLTPRPFTPTPSPTHIMGILLICFIFSITNSFVIAQDDAVPAKSFPVFTPEDNFL
IDCGATSSITLPGNKAFQPDQNTAKYLSYTGKDIQACASDKINVPSTLYVNAKIFTTEAI
YTFHASTSGLHWIRLHFFPFKYEEYDLK
">Solyc11g072930.1.1 LRR receptor-like serine_threonine-protein kinase, RLP"
MASSYFLLLVLVLSVFSVSADVFVSLDCGSSEAYTDHETSIDWLGDVDYVANGESHVVPS
NNSISHVSALEVRGLDSTMYSHVDDNSSDPPRITALYLSKFNLSGSLPDFSSMDAL
ETIDLSNNNLDGPIPDFFGTLPNLKELNLANNKFSGPVPASLSNKNGLTLDTSGNSDLCS
SSEESCQNNDSSSPGNDQPTTGSTNNNKKKKKKKNNLPIILGTTISAFLLLWAIVGIFAI
LHYKNKRAATSLINPGQASGGSTPFVDRVQMSEKIEKNPEVTAHDHENSTNV
">Solyc12g00890.1.1 Kinesin IPR001752 Kinesin, motor region"
ESVINGRDLLGFSLTSPDLVICTGSPDIPARNYGDSPEFLKGCSISLENGI
KGSEEVQAATKLFTDWQGSKDDDLCAPADFELPSPPVEENSSELSVPIVSINVGSTDCIS
SESGIQFSEDKYFCGGNVLSTDTRIEESICASVYQTARVGNFSYHFNNLSAGFYLVDLHF
VEVVLTDGSTGDFSENSPQRNSLEVNGDIKAAGKLQLANVSREK

复制代码

这些示例数据，就用BioPerl的Bio::SeqIO模块来读只能识别第一个序列！

#!/usr/bin/perl
use strict;
use Bio::SeqIO;
use Bio::Seq;
my $fasta=shift @ARGV;
(my $Out=$fasta)=~s/(\.[^\.]+)$/_out$1/;
open (IN,"<$fasta") or die "Open $fasta failed!\n";
my $Out=Bio::SeqIO->new(-file=>">$Out",-format=>'fasta');
my ($flag,$seq,$id,$desc)=();
while(my $line=<IN>){
chomp($line);
if($line=~/\>/){
if($flag){
print "$id\t$desc\n$seq\n";
my $SEQ_OBJ=Bio::Seq->new(-seq=>$seq,-id=>$id,-desc=>$desc,-alphabet=>'protein');
$Out->write_seq($SEQ_OBJ);
}
$line=~s/[\"\>]//g;
($id,$desc)=split (/\s+/,$line,2);
$seq=undef;
$flag=1;
}else{
$seq.=$line;
}
}
print "$id\t$desc\n$seq\n";
my $SEQ_OBJ=Bio::Seq->new(-seq=>$seq,-id=>$id,-desc=>$desc,-alphabet=>'protein');
$Out->write_seq($SEQ_OBJ);
$Out->close();

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

一串儿葡萄皮

白手起家

论坛徽章:: 0

15楼 [报告]

发表于 2015-08-12 15:04 |只看该作者

受教了，这里果然是个好地方，谢谢回复 12# MMMIX

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

一串儿葡萄皮

白手起家

论坛徽章:: 0

16楼 [报告]

发表于 2015-08-12 15:20 |只看该作者

(my $Out=$fasta)=~s/(\.[^\.]+)$/_out$1/;这一句怎么理解？O(∩_∩)O谢谢

回复 14# b114213903

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

MMMIX

广告杀手

论坛徽章:: 95

17楼 [报告]

发表于 2015-08-12 15:28 |只看该作者

一串儿葡萄皮发表于 2015-08-12 15:20
(my $Out=$fasta)=~s/(\.[^\.]+)$/_out$1/;

等价于:

my $Out = $fasta;
$Out =~ s/(\.[^\.]+)$/_out$1/;

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

一串儿葡萄皮

白手起家

论坛徽章:: 0

18楼 [报告]

发表于 2015-08-12 16:33 |只看该作者

2
my ($flag,$seq,$id)=();
--------------------- WARNING ---------------------
MSG: sequence '1' doesn't validate, mismatch is ($,,$,,$,),();
---------------------------------------------------
------------- EXCEPTION -------------
MSG: Attempting to set the sequence '1' to [my ($flag,$seq,$id)=();] which does not look healthy
STACK Bio::PrimarySeq::seq /usr/lib64/perl5/vendor_perl/5.16.0/Bio/PrimarySeq.pm:285
STACK Bio::PrimarySeq::new /usr/lib64/perl5/vendor_perl/5.16.0/Bio/PrimarySeq.pm:239
STACK Bio::Seq::new /usr/lib64/perl5/vendor_perl/5.16.0/Bio/Seq.pm:497
STACK toplevel delete_qw-A.pl:18
-------------------------------------