免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1808 | 回复: 6
打印 上一主题 下一主题

新手求教 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-07-24 16:58 |只看该作者 |倒序浏览
我想从文件A读取一行字符串去匹配文件B的每一行字符串,并计数
例:
文件A中:                                文件B中:
aaaaaa                                       >1
aaaaac                                        atgcaatatgctgatgggccattgatgat........
atgcta                                          >2
........                                             tttgatgctgatgctatgatagtcgtagt.......
                                                    >3
                                                     cccgatgatagtagattagatatgata......
                                                     >4
                                                     ..........

用文件A中的第一个字符串去匹配文件B中的每一行字符串,并计数共匹配到多少行,然后再读取文件A的第二个字符串去匹配文件B的每一行,并计数,依此类推,我是这么写的
open(FILEA, "char.txt") || die;
open(FILEB, "seq.fasta") || die;
open(FILEC, ">obs_seq.txt") || die;


while($line=<FILEA>){
        $num=0;
        chomp($line);
        while($seq=<FILEB>){       
                if($seq=~m/$line/i/g){
                        $num++;
                        }
                }
                print FILEC "$line: $num\n";
               
        }


close(FILEA);
close(FILEB);
close(FILEC);

运行后只匹配了文件A的第一个字符串,就没有执行下去了,如第一个是"aaaaaa",就只能找到有"aaaaaa"序列,第二个"aaaaac"的就不找了,如下面的结果:
aaaaaa: 616
aaaaac: 0
aaaaag: 0
aaaaat: 0
aaaaca: 0
aaaacc: 0
aaaacg: 0
aaaact: 0
aaaaga: 0
...
...

请高手指点一下,是哪不对,应该怎么写.谢谢!

论坛徽章:
0
2 [报告]
发表于 2010-07-24 22:20 |只看该作者
本帖最后由 sharewith 于 2010-07-24 22:21 编辑

open(FILEB, "seq.fasta") || die;

这行的位置有问题,不应该在开始就打开,修改如下,将open FILEB 放到循环体内

  6 while($line=<FILEA>){
  7         $num=0;
  8         chomp($line);
  9         open(FILEB, "seq.fasta") || die;
10         while($seq=<FILEB>){        
11                 if($seq=~m/$line/ig){
12                         $num++;
13                 }
14         }
15         print FILEC "$line: $num\n";
16         close(FILEB);
17
18 }

论坛徽章:
0
3 [报告]
发表于 2010-07-25 10:30 |只看该作者
确实是如此, 修改后运行正确, 非常的感谢!

论坛徽章:
0
4 [报告]
发表于 2010-07-25 12:22 |只看该作者
本帖最后由 paktc 于 2010-07-25 12:24 编辑

我选择把内容存到数组中了

  1. #!/usr/bin/perl
  2. open FA,"<a.x";
  3. open FB,"<b.x";
  4. chomp (@texta=<FA>);  #这个括号不能去
  5. @textb=<FB>;
  6. close FA;
  7. close FB;
  8. foreach $i (@texta) {
  9.    $item{$i}=0;
  10.    foreach $j (@textb) {
  11.       if ($j=~/$i/) {$item{$i}+=1;}
  12.    }
  13.    print "$i , $item{$i}\n";
  14. }
复制代码

论坛徽章:
0
5 [报告]
发表于 2010-07-25 13:04 |只看该作者
LZ作生物信息的吧?哈哈~

论坛徽章:
0
6 [报告]
发表于 2010-07-25 17:07 |只看该作者
正是,兄台是同道中人?小弟刚入门还请多多指教

论坛徽章:
0
7 [报告]
发表于 2010-07-26 18:33 |只看该作者
回复 6# estbio
同是菜鸟,共勉共勉…~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP