免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3116 | 回复: 5
打印 上一主题 下一主题

perl实现两个文件中数据的交集??? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-09-03 08:57 |只看该作者 |倒序浏览
有两个文件 a、b。其中的数据都是连续性的

a:ACCUTCUTCUTGGCTTAGACUGAUCGACUGCAUGCAUGCAU.......
b:TCCUTTTTCUTUATUCATUCTAUCTAUUCGACUGCTTTGGTCGCT.....
其中交集数据有UCGACUGC、CUTTTTCUT
请问用perl如何讲这交集的数据找出来,并打

[ 本帖最后由 hu145165 于 2009-9-3 16:43 编辑 ]

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
2 [报告]
发表于 2009-09-03 09:06 |只看该作者

回复 #1 hu145165 的帖子

如何理解交集?b中并没有CUTTTTCUT。

论坛徽章:
1
辰龙
日期:2014-05-15 19:37:15
3 [报告]
发表于 2009-09-03 10:09 |只看该作者
原帖由 hu145165 于 2009-9-3 08:57 发表
有两个文件 a、b。其中的数据都是连续性的

a:ACCUTCUTCUTTTTCUTGGCTTAGACUGAUCGACUGCAUGCAUGCAU.......
b:TCUATUCATUCTAUCTAUUCGACUGCTTTGGTCGCT.....
其中交集数据有UCGACUGC、CUTTTTCUT
请问用p ...




请看以前的帖子,如下微软面世试题-最大公共串-求两个字符串的最大公共子串的一个有意思的题目,我想这个就是你所要的吧
http://bbs.chinaunix.net/viewthread.php?tid=1333575

论坛徽章:
0
4 [报告]
发表于 2009-09-03 16:42 |只看该作者
原帖由 blackold 于 2009-9-3 09:06 发表
如何理解交集?b中并没有CUTTTTCUT。

对不起 是我没有把数据处理好 已经更正

论坛徽章:
0
5 [报告]
发表于 2009-09-03 17:08 |只看该作者
既然是核苷酸序列,当然用 BLAST 了。

论坛徽章:
0
6 [报告]
发表于 2009-09-03 17:58 |只看该作者
原帖由 iakuf 于 2009-9-3 10:09 发表




请看以前的帖子,如下微软面世试题-最大公共串-求两个字符串的最大公共子串的一个有意思的题目,我想这个就是你所要的吧
http://bbs.chinaunix.net/viewthread.php?tid=1333575

sub string($$){
  my ($strmin,$strmax) = @_;
       for( my $i = 0; $i < length($strmax); $i++) {
           $lstrmin = substr($strmin, $i);
           my $nowstr;
           for(my $j=0; $j< length($lstrmin);$j++){
                 my @list=split '',$lstrmin;
                 $nowstr .= @list[$j];
                 if (index($strmax, $nowstr)>=1 && length($nowstr) > length($r)){
                        $r = $nowstr;
                }

        }
    }
        return  $r;
}
谢谢你 这个算法很好用
如果我的数据中出现的是2个 或者2个以上的。
其实我想$b=~s//sub($a,$b)/
            $b=~s//sub($a,$b)/
然后再继续 直到没有可以匹配的
不知这样是否可以

[ 本帖最后由 hu145165 于 2009-9-4 08:30 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP