免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Perl › 已经解决.结贴脚本 Perl - 正则匹配过程 (分组组值)

1 234 / 4 页下一页

最近访问板块

发新帖

楼主: sunzhiguolu

上一主题

下一主题

已经解决.结贴脚本 Perl - 正则匹配过程 (分组组值) [复制链接]

论坛徽章:: 145

技术图书徽章
日期:2013-10-01 15:32:13

戌狗
日期:2013-10-25 13:31:35

金牛座
日期:2013-11-04 16:22:07

子鼠
日期:2013-11-18 18:48:57

白羊座
日期:2013-11-29 10:09:11

狮子座
日期:2013-12-12 09:57:42

白羊座
日期:2013-12-24 16:24:46

辰龙
日期:2014-01-08 15:26:12

技术图书徽章
日期:2014-01-17 13:24:40

巳蛇
日期:2014-02-18 14:32:59

未羊
日期:2014-02-20 14:12:13

白羊座
日期:2014-02-26 12:06:59

21楼 [报告]

发表于 2015-09-26 23:08 |只看该作者

回复 20# sunzhiguolu

It's hard to know what you say...
或
演示一下，正则的匹配过程，你就会得到你想要的答案？

评分

参与人数 1	信誉积分 +10	收起理由
sunzhiguolu	+ 10	您的提示总是那么到位! (是我太笨了) 多谢多.

查看全部评分

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 95

程序设计版块每日发帖之星
日期:2015-09-05 06:20:00

程序设计版块每日发帖之星
日期:2015-09-17 06:20:00

程序设计版块每日发帖之星
日期:2015-09-18 06:20:00

2015亚冠之阿尔艾因
日期:2015-09-18 10:35:08

月度论坛发贴之星
日期:2015-09-30 22:25:00

2015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39

程序设计版块每日发帖之星
日期:2015-10-05 06:20:00

每日论坛发贴之星
日期:2015-10-05 06:20:00

2015年亚冠纪念徽章
日期:2015-10-06 10:06:48

2015亚冠之塔什干棉农
日期:2015-10-19 19:43:35

程序设计版块每日发帖之星
日期:2015-10-21 06:20:00

每日论坛发贴之星
日期:2015-09-14 06:20:00

22楼 [报告]

发表于 2015-09-26 23:13 |只看该作者

本帖最后由 MMMIX 于 2015-09-27 12:05 编辑

回复 19# sunzhiguolu

实在看不明白你都在说啥，我还是直接描述下这个正则的匹配过程吧。

把正则表达式 \b(([0-9])\2)+4 拆成三部分，分别为 re1 = \b, re2 = (([0-9])\2), re3 = 4, 整个正则记为 re. 那么 re 匹配字符串 "11223344" 的过程如下：

1. 先匹配 re1 = \b

由于 \b 是 word 边界，可以匹配到字符串开始；所以匹配成功，匹配结束的位置为字符串开头。

2. 然后匹配 re2 = (([0-9]\2)+，匹配开始的位置为 re1 匹配结束的位置，也即字符串的开头

2.1 (([0-9])\2) 匹配 "11.." 成功，此时 $1 = "11", $2 = 1;

2.2 由于有 +，所以继续匹配 (([0-9])\2)，直到无法继续为止；

2.3 $1 和 $2 的值依次为 “22”， “2”（第二次），“33”，“3”（第三次），“44”，“4”（第四次）；

2.4 此时已到字符串结尾，无法继续，re2 匹配成功，匹配结束位置为字符串结尾

3. 然后匹配 re3 = 4，匹配开始位置为 re2 匹配结束的位置，也即字符串的结尾

3.1 re3 匹配失败；

3.2 匹配位置回退一个字符，检查在此位置匹配 re2是否能成功；若失败，继续回退；

3.3 匹配位置回退两个字符之后，re2 可以匹配成功；此时匹配位置在 3 和 4 之间，$1 = "33", $2 = "3";

4. 重新匹配 re3 = 4，匹配开始位置在 3 和 4 之间，匹配成功；

5. 整个正则 re 匹配成功。

注意，虽然整体上 (([0-9])\2)+ 会匹配到 "112233"，但是由于 + 相当于一个循环，在每次循环中，(([0-9])\2) 匹配到的内容都是不一样的，从而每次循环中 $1 和 $2 的值也都不一样，而最终的 $1 和 $2 的值是其循环过程中最后一次的值。

评分

参与人数 1	信誉积分 +10	收起理由
sunzhiguolu	+ 10	很给力! 我懂了, 谢谢您!

查看全部评分

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 307

程序设计版块每周发帖之星
日期:2016-04-08 00:41:33

操作系统版块每日发帖之星
日期:2015-09-02 06:20:00

每日论坛发贴之星
日期:2015-09-02 06:20:00

程序设计版块每日发帖之星
日期:2015-09-04 06:20:00

每日论坛发贴之星
日期:2015-09-04 06:20:00

每周论坛发贴之星
日期:2015-09-06 22:22:00

程序设计版块每日发帖之星
日期:2015-09-09 06:20:00

程序设计版块每日发帖之星
日期:2015-09-19 06:20:00

程序设计版块每日发帖之星
日期:2015-09-20 06:20:00

每日论坛发贴之星
日期:2015-09-20 06:20:00

程序设计版块每日发帖之星
日期:2015-09-22 06:20:00

程序设计版块每日发帖之星
日期:2015-09-24 06:20:00

23楼 [报告]

发表于 2015-09-26 23:13 |只看该作者

本帖最后由 sunzhiguolu 于 2015-09-26 23:51 编辑

回复 21# jason680

演示一下，正则的匹配过程，你就会得到你想要的答案？

您能否多给点提示. (我没有明白您所说的演示是什么意思) 能否举个例子? 或用什么工具和方法可以完成此目的.
看来我明白您说的演示一下正则的匹配过程了, 元字符 "\b" 不是摆设, 通过大神 "MMMIX" 的描述更能说明了解正则匹配原理的重要性.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 307

程序设计版块每周发帖之星
日期:2016-04-08 00:41:33

操作系统版块每日发帖之星
日期:2015-09-02 06:20:00

每日论坛发贴之星
日期:2015-09-02 06:20:00

程序设计版块每日发帖之星
日期:2015-09-04 06:20:00

每日论坛发贴之星
日期:2015-09-04 06:20:00

每周论坛发贴之星
日期:2015-09-06 22:22:00

程序设计版块每日发帖之星
日期:2015-09-09 06:20:00

程序设计版块每日发帖之星
日期:2015-09-19 06:20:00

程序设计版块每日发帖之星
日期:2015-09-20 06:20:00

每日论坛发贴之星
日期:2015-09-20 06:20:00

程序设计版块每日发帖之星
日期:2015-09-22 06:20:00

程序设计版块每日发帖之星
日期:2015-09-24 06:20:00

24楼 [报告]

发表于 2015-09-27 11:09 |只看该作者

本帖最后由 sunzhiguolu 于 2015-09-27 11:25 编辑

回头想想您描述的正则匹配的过程, 有一点不是很明白. 特向您求证:

3.3 匹配位置回退两个字符之后，re2 可以匹配成功；

此时 re2 是否遵循像开始匹配那样的匹配过程:

"2.3 $1 和 $2 的值依次为 “22”， “2”（第二次），“33”，“3”（第三次）"

依次进行匹配尝试, 而最终的匹配结果就是 $1 = 33, $2 = 3, 最后在 re2 匹配结束后交由 re3 去匹配 re2 匹配结束的位置 (字符 3 和 4 之间的位置). 即字符串结尾的倒数第二个字符 4, 匹配成功. 至此完成本次匹配过程. (我的描述如有不对, 请您指点.)

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 95

程序设计版块每日发帖之星
日期:2015-09-05 06:20:00

程序设计版块每日发帖之星
日期:2015-09-17 06:20:00

程序设计版块每日发帖之星
日期:2015-09-18 06:20:00

2015亚冠之阿尔艾因
日期:2015-09-18 10:35:08

月度论坛发贴之星
日期:2015-09-30 22:25:00

2015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39

程序设计版块每日发帖之星
日期:2015-10-05 06:20:00

每日论坛发贴之星
日期:2015-10-05 06:20:00

2015年亚冠纪念徽章
日期:2015-10-06 10:06:48

2015亚冠之塔什干棉农
日期:2015-10-19 19:43:35

程序设计版块每日发帖之星
日期:2015-10-21 06:20:00

每日论坛发贴之星
日期:2015-09-14 06:20:00

25楼 [报告]

发表于 2015-09-27 12:02 |只看该作者

回复 24# sunzhiguolu

再把我描述的过程看一遍，还有疑问的话就再看一遍。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 307

程序设计版块每周发帖之星
日期:2016-04-08 00:41:33

操作系统版块每日发帖之星
日期:2015-09-02 06:20:00

每日论坛发贴之星
日期:2015-09-02 06:20:00

程序设计版块每日发帖之星
日期:2015-09-04 06:20:00

每日论坛发贴之星
日期:2015-09-04 06:20:00

每周论坛发贴之星
日期:2015-09-06 22:22:00

程序设计版块每日发帖之星
日期:2015-09-09 06:20:00

程序设计版块每日发帖之星
日期:2015-09-19 06:20:00

程序设计版块每日发帖之星
日期:2015-09-20 06:20:00

每日论坛发贴之星
日期:2015-09-20 06:20:00

程序设计版块每日发帖之星
日期:2015-09-22 06:20:00

程序设计版块每日发帖之星
日期:2015-09-24 06:20:00

26楼 [报告]

发表于 2015-09-27 13:07 |只看该作者

本帖最后由 sunzhiguolu 于 2015-09-27 13:11 编辑

回复 25# MMMIX
好的, 祝您中秋快乐!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 307

程序设计版块每周发帖之星
日期:2016-04-08 00:41:33

操作系统版块每日发帖之星
日期:2015-09-02 06:20:00

每日论坛发贴之星
日期:2015-09-02 06:20:00

程序设计版块每日发帖之星
日期:2015-09-04 06:20:00

每日论坛发贴之星
日期:2015-09-04 06:20:00

每周论坛发贴之星
日期:2015-09-06 22:22:00

程序设计版块每日发帖之星
日期:2015-09-09 06:20:00

程序设计版块每日发帖之星
日期:2015-09-19 06:20:00

程序设计版块每日发帖之星
日期:2015-09-20 06:20:00

每日论坛发贴之星
日期:2015-09-20 06:20:00

程序设计版块每日发帖之星
日期:2015-09-22 06:20:00

程序设计版块每日发帖之星
日期:2015-09-24 06:20:00

27楼 [报告]

发表于 2015-09-27 13:08 |只看该作者

本帖最后由 sunzhiguolu 于 2015-09-27 13:12 编辑

回复 13# jason680
祝您中秋快乐!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 307

程序设计版块每周发帖之星
日期:2016-04-08 00:41:33

操作系统版块每日发帖之星
日期:2015-09-02 06:20:00

每日论坛发贴之星
日期:2015-09-02 06:20:00

程序设计版块每日发帖之星
日期:2015-09-04 06:20:00

每日论坛发贴之星
日期:2015-09-04 06:20:00

每周论坛发贴之星
日期:2015-09-06 22:22:00

程序设计版块每日发帖之星
日期:2015-09-09 06:20:00

程序设计版块每日发帖之星
日期:2015-09-19 06:20:00

程序设计版块每日发帖之星
日期:2015-09-20 06:20:00

每日论坛发贴之星
日期:2015-09-20 06:20:00

程序设计版块每日发帖之星
日期:2015-09-22 06:20:00

程序设计版块每日发帖之星
日期:2015-09-24 06:20:00

28楼 [报告]

发表于 2015-09-27 13:09 |只看该作者

本帖最后由 sunzhiguolu 于 2015-09-27 13:12 编辑

回复 9# 104359176
祝您中秋快乐!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 307

程序设计版块每周发帖之星
日期:2016-04-08 00:41:33

操作系统版块每日发帖之星
日期:2015-09-02 06:20:00

每日论坛发贴之星
日期:2015-09-02 06:20:00

程序设计版块每日发帖之星
日期:2015-09-04 06:20:00

每日论坛发贴之星
日期:2015-09-04 06:20:00

每周论坛发贴之星
日期:2015-09-06 22:22:00

程序设计版块每日发帖之星
日期:2015-09-09 06:20:00

程序设计版块每日发帖之星
日期:2015-09-19 06:20:00

程序设计版块每日发帖之星
日期:2015-09-20 06:20:00

每日论坛发贴之星
日期:2015-09-20 06:20:00

程序设计版块每日发帖之星
日期:2015-09-22 06:20:00

程序设计版块每日发帖之星
日期:2015-09-24 06:20:00

29楼 [报告]

发表于 2015-09-27 13:10 |只看该作者

最后祝论坛的所有像我一样的小伙伴, 前辈, 大神们中秋快乐!!!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

求职 : 软件工程师

论坛徽章:: 3

程序设计版块每日发帖之星
日期:2015-10-07 06:20:00

程序设计版块每日发帖之星
日期:2015-12-13 06:20:00

程序设计版块每日发帖之星
日期:2016-05-05 06:20:00

30楼 [报告]

发表于 2015-09-28 19:01 |只看该作者

是我搞错了，((\d)\2) 是捕获里面的东西，相同的例子在 <<Perl 高效编程>> 中有。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

1 234 / 4 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Perl › 已经解决.结贴脚本 Perl - 正则匹配过程 (分组组值)

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP