免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 4557 | 回复: 20
打印 上一主题 下一主题

连续重复子串的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-04-07 08:59 |只看该作者 |倒序浏览
如果想从一个很长的字符串中查找所有的连续重复的子串,有没有使用正则的简单写法。
例如: $str="ABCDEFGHGHGHAABCDEFGFGFGFG"; 所包含的连续重复子串:“GHGHGH” 和 “FGFGFGFG”;
大家有没有简单的使用正则表达式的方法。

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34子鼠
日期:2013-12-14 14:57:19射手座
日期:2014-04-25 21:23:23
2 [报告]
发表于 2013-04-07 09:19 |只看该作者
  1. perl -le  '$str="ABCDEFGHGHGHAABCDEFGFGFGFG";1 while($str=~/((..)\2+)(?{print $1})/g);'
复制代码

论坛徽章:
0
3 [报告]
发表于 2013-04-07 10:35 |只看该作者
如何得到这些子串在 $str 的位置?

论坛徽章:
0
4 [报告]
发表于 2013-04-07 11:23 |只看该作者
回复 3# gridbird

是这样吗?
  1. my $str="ABCDEFGHGHGHAABCDEFGFGFGFG";
  2. while ( $str =~ /((..)\2+)/g ) {
  3.     print "$1 happens in ", pos($str) - length($1), "\n";
  4. }
复制代码

论坛徽章:
0
5 [报告]
发表于 2013-04-07 12:03 |只看该作者
always got the answer from you, thanks.  
回复 4# kk861123


   

论坛徽章:
0
6 [报告]
发表于 2013-04-07 12:18 |只看该作者
回复 5# gridbird


    you're welcome~

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
7 [报告]
发表于 2013-04-07 14:36 |只看该作者
有一个良好的快速的解决方案,,但我的老师 kk861123 并没有提到它, 因为它不是一个合适的时间对你,它是关於一个特殊的变量:
  1. my $str = "ABCDEFGHGHGHAABCDEFGFGFGFG";
  2. while ( $str =~ /((..)\2+)/g ) {
  3.     print "$1 happens in ", $-[0], "\n";
  4. }
复制代码
sinian126 该用户已被删除
8 [报告]
发表于 2013-04-07 15:40 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
6
卯兔
日期:2013-11-26 14:52:02丑牛
日期:2014-02-19 18:01:25卯兔
日期:2014-05-20 20:34:06白羊座
日期:2014-05-23 13:39:232015亚冠之大阪钢巴
日期:2015-08-07 20:57:582015亚冠之大阪钢巴
日期:2015-09-02 14:09:09
9 [报告]
发表于 2013-04-07 16:09 |只看该作者
{:3_193:} 多谢回复 7# rubyish


   

论坛徽章:
0
10 [报告]
发表于 2013-04-07 18:23 |只看该作者
thanks. 我的确google 到了你的这种方式, 但是对于特别长的 $str, 例如: length($str) = 200MB;

perl 给出了如下的警告信息:

Complex regular subexpression recursion limit (32766) exceeded at ./test.pl line 112, <REF> line 1789160.

试了 perl 5.8 和 5.10 , 都给出了如上的警告信息。

any ideas?


回复 7# rubyish


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP