免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: sunzhiguolu
打印 上一主题 下一主题

已经解决.结贴 脚本 Perl - 正则匹配过程 (分组 组值) [复制链接]

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
21 [报告]
发表于 2015-09-26 23:08 |只看该作者
回复 20# sunzhiguolu

It's hard to know what you say...

演示一下,正则的匹配过程,你就会得到你想要的答案?

  

评分

参与人数 1信誉积分 +10 收起 理由
sunzhiguolu + 10 您的提示总是那么到位! (是我太笨了) 多谢多.

查看全部评分

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
22 [报告]
发表于 2015-09-26 23:13 |只看该作者
本帖最后由 MMMIX 于 2015-09-27 12:05 编辑

回复 19# sunzhiguolu


    实在看不明白你都在说啥,我还是直接描述下这个正则的匹配过程吧。

把正则表达式 \b(([0-9])\2)+4 拆成三部分,分别为 re1 = \b, re2 = (([0-9])\2), re3 = 4, 整个正则记为 re. 那么 re 匹配字符串 "11223344" 的过程如下:

1. 先匹配 re1 = \b

由于 \b 是 word 边界,可以匹配到字符串开始;所以匹配成功,匹配结束的位置为字符串开头。

2. 然后匹配 re2 = (([0-9]\2)+,匹配开始的位置为 re1 匹配结束的位置,也即字符串的开头

2.1 (([0-9])\2) 匹配 "11.." 成功,此时 $1 = "11", $2 = 1;

2.2 由于有 +,所以继续匹配 (([0-9])\2),直到无法继续为止;

2.3 $1 和 $2 的值依次为 “22”, “2”(第二次),“33”,“3”(第三次),“44”,“4”(第四次);

2.4 此时已到字符串结尾,无法继续,re2 匹配成功,匹配结束位置为字符串结尾

3. 然后匹配 re3 = 4,匹配开始位置为 re2 匹配结束的位置,也即字符串的结尾

3.1 re3 匹配失败;

3.2 匹配位置回退一个字符,检查在此位置匹配 re2是否能成功;若失败,继续回退;

3.3 匹配位置回退两个字符之后,re2 可以匹配成功;此时匹配位置在 3 和 4 之间,$1 = "33", $2 = "3";

4. 重新匹配 re3 = 4,匹配开始位置在 3 和 4 之间,匹配成功;

5. 整个正则 re 匹配成功。

注意,虽然整体上 (([0-9])\2)+ 会匹配到 "112233",但是由于 + 相当于一个循环,在每次循环中,(([0-9])\2) 匹配到的内容都是不一样的,从而每次循环中 $1 和 $2 的值也都不一样,而最终的 $1 和 $2 的值是其循环过程中最后一次的值。

评分

参与人数 1信誉积分 +10 收起 理由
sunzhiguolu + 10 很给力! 我懂了, 谢谢您!

查看全部评分

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
23 [报告]
发表于 2015-09-26 23:13 |只看该作者
本帖最后由 sunzhiguolu 于 2015-09-26 23:51 编辑

回复 21# jason680
演示一下,正则的匹配过程,你就会得到你想要的答案?

    您能否多给点提示.  (我没有明白您所说的演示是什么意思) 能否举个例子? 或用什么工具和方法可以完成此目的.
看来我明白您说的演示一下正则的匹配过程了, 元字符 "\b" 不是摆设, 通过大神 "MMMIX" 的描述更能说明了解正则匹配原理的重要性.

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
24 [报告]
发表于 2015-09-27 11:09 |只看该作者
本帖最后由 sunzhiguolu 于 2015-09-27 11:25 编辑

回头想想您描述的正则匹配的过程, 有一点不是很明白. 特向您求证:
3.3 匹配位置回退两个字符之后,re2 可以匹配成功;

此时 re2 是否遵循像开始匹配那样的匹配过程:
"2.3 $1 和 $2 的值依次为 “22”, “2”(第二次),“33”,“3”(第三次)"

依次进行匹配尝试, 而最终的匹配结果就是 $1 = 33, $2 = 3, 最后在 re2 匹配结束后交由 re3 去匹配 re2 匹配结束的位置 (字符 3 和 4 之间的位置). 即字符串结尾的倒数第二个字符 4, 匹配成功. 至此完成本次匹配过程. (我的描述如有不对, 请您指点.)

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
25 [报告]
发表于 2015-09-27 12:02 |只看该作者
回复 24# sunzhiguolu


    再把我描述的过程看一遍,还有疑问的话就再看一遍。

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
26 [报告]
发表于 2015-09-27 13:07 |只看该作者
本帖最后由 sunzhiguolu 于 2015-09-27 13:11 编辑

回复 25# MMMIX
好的, 祝您中秋快乐!

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
27 [报告]
发表于 2015-09-27 13:08 |只看该作者
本帖最后由 sunzhiguolu 于 2015-09-27 13:12 编辑

回复 13# jason680
祝您中秋快乐!

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
28 [报告]
发表于 2015-09-27 13:09 |只看该作者
本帖最后由 sunzhiguolu 于 2015-09-27 13:12 编辑

回复 9# 104359176
祝您中秋快乐!

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
29 [报告]
发表于 2015-09-27 13:10 |只看该作者
最后祝论坛的所有像我一样的小伙伴, 前辈, 大神们 中秋快乐!!!

求职 : 软件工程师
论坛徽章:
3
程序设计版块每日发帖之星
日期:2015-10-07 06:20:00程序设计版块每日发帖之星
日期:2015-12-13 06:20:00程序设计版块每日发帖之星
日期:2016-05-05 06:20:00
30 [报告]
发表于 2015-09-28 19:01 |只看该作者
是我搞错了,((\d)\2) 是捕获里面的东西,相同的例子在 <<Perl 高效编程>> 中有。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP