免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Perl › 重排fasta文档求助

12 / 2 页

最近访问板块

发新帖

楼主: 萌情公方

上一主题

下一主题

重排fasta文档求助 [复制链接]

论坛徽章:: 33

荣誉会员
日期:2011-11-23 16:44:17

天秤座
日期:2014-08-26 16:18:20

天秤座
日期:2014-08-29 10:12:18

丑牛
日期:2014-08-29 16:06:45

丑牛
日期:2014-09-03 10:28:58

射手座
日期:2014-09-03 16:01:17

寅虎
日期:2014-09-11 14:24:21

天蝎座
日期:2014-09-17 08:33:55

IT运维版块每日发帖之星
日期:2016-04-17 06:23:27

操作系统版块每日发帖之星
日期:2016-04-18 06:20:00

IT运维版块每日发帖之星
日期:2016-04-24 06:20:00

15-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59

11楼 [报告]

发表于 2014-07-21 17:54 |只看该作者

回复 9# 萌情公方

你得提供至少有三段数据才能测试. 也就是至少 300个字符的原始文件.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

12楼 [报告]

发表于 2014-07-21 18:50 |只看该作者

解决了，原来是我的输入里夹着空格，所以就乱了，谢谢啊回复 10# afukada

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

13楼 [报告]

发表于 2014-07-21 18:51 |只看该作者

已经解决了，加了句$seq=~s/\s//g;就好了，谢谢啊{:2_172:} 回复 11# q1208c

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

14楼 [报告]

发表于 2014-07-22 16:09 |只看该作者

#!/usr/bin/perl -w
open OUT1,">out1.txt";
open IN1,"<1.txt";
my %hash;
my $value;
my @value;
local $/=">";
<IN1>;
while (<IN1>) {
chomp;
my($key,$value)=split/\n/,$_,2;
my $seq= substr ($value,0,100);
$hash{$key} = $seq;
}
foreach my $key (sort keys %hash) {
print "$key\n";
print OUT1 "\>$key\n$hash{$key}\n";
}
close IN1;
close OUT1;

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

15楼 [报告]

发表于 2014-07-22 18:18 |只看该作者

换了一种思路，学习啦，哈哈哈回复 14# hubenxia

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

16楼 [报告]

发表于 2014-07-22 18:22 |只看该作者

回复 15# 萌情公方
我这个还是有点问题。我在重写

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

17楼 [报告]

发表于 2014-07-22 19:08 |只看该作者

#!/usr/bin/perl -w
open OUT1,">out1.txt";
open IN1,"<1.txt";
my %hash;
my ($value,$seq);
$/=">";
<IN1>;
while (<IN1>) {
chomp;
my @value=split "\n";
my $key=shift @value;
s/\n//g;
$value=join "",@value;
$seq= substr ($value,0,100);
$hash{$key} = $seq;
}
foreach my $key (sort keys %hash) {
print OUT1 "\>$key\n$hash{$key}\n";
}
close IN1;
close OUT1;

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 7

巳蛇
日期:2013-11-28 09:22:59

天秤座
日期:2014-10-25 15:40:45

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015年迎新春徽章
日期:2015-03-04 09:53:17

2015亚冠之德黑兰石油
日期:2015-07-15 08:46:45

2015亚冠之平阳省
日期:2015-11-08 16:27:53

白银圣斗士
日期:2015-11-14 09:58:12

18楼 [报告]

发表于 2014-07-23 10:37 |只看该作者

#!/usr/bin/perl
use BIO::SeqIO;
my $Seq_OBJ=Bio::SeqIO->new(-fh=>\*DATA,-format=>"fasta");
while(my $Seq=$Seq_OBJ->next_seq()){
my $id=$Seq->id;
my $seq=$Seq->seq;
$seq=~s/(\w{100})/$1\n/g;
print ">$id\n$seq\n";
}
__DATA__
>1 dna:chromosome chromosome:Zv9:1:1:60348388:1 REF
TTCTTCTGGGGAAAGTCTGATTTGATTTATTTCCCTTTTAAGATCAATATTATTAGCCCC
ATGTGTTGAAGAACAAATCTCTCTGTTAAACAGAAATTGGGGGGGAAAATAAACAGGGGG

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

19楼 [报告]

发表于 2014-09-28 15:23 |只看该作者

################################################
sub out_fasta{
my ($seq,$num) = @_;
my $len = length $seq;
$seq =~ s/([A-Za-z]{$num})/$1\n/g;
chop($seq) unless $len % $num;
return $seq;
}
################################################
sub reverse_complement{
my ($seq)=shift;
$seq=reverse$seq;
$seq=~tr/AaGgCcTt/TtCcGgAa/;
return $seq;
}
################################################
sub read_fa{
my ($file,$p) = @_;
open IN,$file || die;
$/=">";<IN>;$/="\n";
while(<IN>){
my $id = $1 if /^(\S+)/;
$/=">";chomp(my $fa = <IN>);$/="\n";
$fa =~ s/\n+//g;
$p->{$id} = $fa;
}
close IN;
}

复制代码

萌情公方发表于 2014-07-21 10:34
现在我想从fasta序列中，每一百个字母作为一行输出，但是我的代码运行的结果总是不对，请大神帮忙看看吧:
...

可以参考这几个子函数。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页

发新帖

Chinaunix › 论坛 › 程序设计 › Perl › 重排fasta文档求助

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP