免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: 萌情公方
打印 上一主题 下一主题

重排fasta文档求助 [复制链接]

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
11 [报告]
发表于 2014-07-21 17:54 |只看该作者
回复 9# 萌情公方

你得提供至少有三段数据才能测试. 也就是至少 300个字符的原始文件.
   

论坛徽章:
0
12 [报告]
发表于 2014-07-21 18:50 |只看该作者
解决了,原来是我的输入里夹着空格,所以就乱了,谢谢啊回复 10# afukada


   

论坛徽章:
0
13 [报告]
发表于 2014-07-21 18:51 |只看该作者
已经解决了,加了句$seq=~s/\s//g;就好了,谢谢啊{:2_172:} 回复 11# q1208c


   

论坛徽章:
0
14 [报告]
发表于 2014-07-22 16:09 |只看该作者
#!/usr/bin/perl -w
open OUT1,">out1.txt";
open IN1,"<1.txt";
my %hash;
my $value;
my @value;
local $/=">";
<IN1>;
while (<IN1>) {
        chomp;
        my($key,$value)=split/\n/,$_,2;
        my $seq= substr ($value,0,100);
        $hash{$key} = $seq;
}
foreach my $key (sort keys %hash) {
        print "$key\n";
        print OUT1 "\>$key\n$hash{$key}\n";
}
close IN1;
close OUT1;

论坛徽章:
0
15 [报告]
发表于 2014-07-22 18:18 |只看该作者
换了一种思路,学习啦,哈哈哈回复 14# hubenxia


   

论坛徽章:
0
16 [报告]
发表于 2014-07-22 18:22 |只看该作者
回复 15# 萌情公方
我这个还是有点问题。  我在重写

   

论坛徽章:
0
17 [报告]
发表于 2014-07-22 19:08 |只看该作者
#!/usr/bin/perl -w
open OUT1,">out1.txt";
open IN1,"<1.txt";
my %hash;
my ($value,$seq);
$/=">";
<IN1>;
while (<IN1>) {
        chomp;
        my @value=split "\n";
        my $key=shift @value;
                s/\n//g;
        $value=join "",@value;
        $seq= substr ($value,0,100);
        $hash{$key} = $seq;
}
foreach my $key (sort keys %hash) {
        print OUT1 "\>$key\n$hash{$key}\n";
}
close IN1;
close OUT1;

论坛徽章:
7
巳蛇
日期:2013-11-28 09:22:59天秤座
日期:2014-10-25 15:40:452015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:53:172015亚冠之德黑兰石油
日期:2015-07-15 08:46:452015亚冠之平阳省
日期:2015-11-08 16:27:53白银圣斗士
日期:2015-11-14 09:58:12
18 [报告]
发表于 2014-07-23 10:37 |只看该作者
  1. #!/usr/bin/perl
  2. use BIO::SeqIO;

  3. my $Seq_OBJ=Bio::SeqIO->new(-fh=>\*DATA,-format=>"fasta");
  4. while(my $Seq=$Seq_OBJ->next_seq()){
  5.         my $id=$Seq->id;
  6.         my $seq=$Seq->seq;
  7.         $seq=~s/(\w{100})/$1\n/g;
  8.         print ">$id\n$seq\n";
  9. }

  10. __DATA__
  11. >1 dna:chromosome chromosome:Zv9:1:1:60348388:1 REF
  12. TTCTTCTGGGGAAAGTCTGATTTGATTTATTTCCCTTTTAAGATCAATATTATTAGCCCC
  13. ATGTGTTGAAGAACAAATCTCTCTGTTAAACAGAAATTGGGGGGGAAAATAAACAGGGGG
复制代码

论坛徽章:
0
19 [报告]
发表于 2014-09-28 15:23 |只看该作者
  1. ################################################                           
  2. sub out_fasta{
  3.         my ($seq,$num) = @_;
  4.         my $len = length $seq;
  5.         $seq =~ s/([A-Za-z]{$num})/$1\n/g;
  6.         chop($seq) unless $len % $num;
  7.         return $seq;
  8. }
  9. ################################################
  10. sub reverse_complement{
  11.         my ($seq)=shift;
  12.         $seq=reverse$seq;
  13.         $seq=~tr/AaGgCcTt/TtCcGgAa/;
  14.         return $seq;
  15. }
  16. ################################################
  17. sub read_fa{
  18.         my ($file,$p) = @_;
  19.         open IN,$file || die;
  20.         $/=">";<IN>;$/="\n";
  21.         while(<IN>){
  22.                 my $id = $1 if /^(\S+)/;
  23.                 $/=">";chomp(my $fa = <IN>);$/="\n";
  24.                 $fa =~ s/\n+//g;
  25.                 $p->{$id} = $fa;
  26.         }
  27.         close IN;
  28. }
复制代码
萌情公方 发表于 2014-07-21 10:34
现在我想从fasta序列中,每一百个字母作为一行输出,但是我的代码运行的结果总是不对,请大神帮忙看看吧:
...


可以参考这几个子函数。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP