免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5566 | 回复: 18
打印 上一主题 下一主题

正则匹配顺序 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-08-31 20:50 |只看该作者 |倒序浏览
本帖最后由 shihuaqino1 于 2011-08-31 20:52 编辑

$_ = 'three tournaments won';
$_ =~ /tour|to|th/;
print $&;
Perl中正则的匹配顺序应该是从左至右(tour->to->th),而tour就能匹配成功。按照这个逻辑,最后的输出应该是tour。可以事实上结果却是th!!!这是为什么呢?

论坛徽章:
0
2 [报告]
发表于 2011-08-31 21:15 |只看该作者
本帖最后由 3P党人 于 2011-08-31 21:17 编辑
$_ = 'three tournaments won';
$_ =~ /tour|to|th/;
print $&;
Perl中正则的匹配顺序应该是从左至右(t ...
shihuaqino1 发表于 2011-08-31 20:50



八格, 正则引擎在目标字符串上从左到右推进,像外国政府不放弃他们任何一个在外国的侨民一样子,引擎也不会放过任何一次匹配的机会。所以,目标字符串最左边能匹配上的是
three tournaments won

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
3 [报告]
发表于 2011-08-31 21:42 |只看该作者
阿门.

论坛徽章:
0
4 [报告]
发表于 2011-08-31 21:54 |只看该作者
回复 2# 3P党人


    Pel的正则引擎是表达式主导的,也就是说通过表达式去匹配文本;而且多选结构是按序排列的,也就是先完全匹配tour,如果失败再去匹配to,如果还是失败才去匹配th。这个是我的理解。
而按照你的说法,文本'three tournaments won'先拿一个t去匹配表达式,这时三个结构都符合,再拿h去匹配表达式,这是只有第三个结构才匹配,此时匹配成功,返回。这种匹配方式不就是文本主导的么?这和Perl的正则引擎是刚好相反的。

我知道我的理解中肯定有错误的地方,但不知道错在哪里了。

论坛徽章:
0
5 [报告]
发表于 2011-08-31 23:28 |只看该作者
你对 NFA 和 DFA 理解不对,而且市面上的正则引擎基本都是 NFA 的。

论坛徽章:
0
6 [报告]
发表于 2011-08-31 23:44 |只看该作者
类似于:

  1. #!/usr/bin/env perl

  2. use strict;
  3. use warnings;

  4. my $string = "three tournaments won";
  5. my $pos = 0;
  6. my $match;
  7. my $pattern = sub { foreach my $elem (qw(tour to th)) { do { $match = $elem; return 1; } if (index($_[0], $elem) == 0) } return undef; };

  8. while (defined $pos)
  9. {
  10.     last if ($pattern->(substr($string, $pos)));
  11.     if ($pos  < length($string) + 1)
  12.     {
  13.         $pos++;
  14.     }
  15.     else
  16.     {
  17.         $pos = undef;
  18.     }
  19. }

  20. print $match, "\n";
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2011-09-01 09:23 |只看该作者
本帖最后由 jason680 于 2011-09-01 09:27 编辑
回复  3P党人


    Pel的正则引擎是表达式主导的,也就是说通过表达式去匹配文本;而且多选结构是按序 ...
shihuaqino1 发表于 2011-08-31 21:54


试试.....(三个结果都不同)
$_ = 'toree thurnaments won';
if(m/thur|to|th/){
print "1re=$&\n";
}
if(m/thur/ | m/to/ | m/th/){
print "3|=$&\n";
}
if(m/thur/ or m/to/ or m/th/){
print "3or=$&\n";
}

$ perl re.pl
1re=to
3|=th
3or=thur

论坛徽章:
0
8 [报告]
发表于 2011-09-01 09:48 |只看该作者
试试.....(三个结果都不同)
$_ = 'toree thurnaments won';
if(m/thur|to|th/){
print "1re=$&\n";
...
jason680 发表于 2011-09-01 09:23



   
大哥,你要不要回去查查 | 是什么意思?

论坛徽章:
0
9 [报告]
发表于 2011-09-01 09:57 |只看该作者
/tour|to|th/g
回复 1# shihuaqino1

不加一个g你就只匹配了一次,也就是第一个th

论坛徽章:
0
10 [报告]
发表于 2011-09-01 10:07 |只看该作者
回复  shihuaqino1

不加一个g你就只匹配了一次,也就是第一个th
Perl_Er 发表于 2011-09-01 09:57


加了 /g, 你也匹配一次

if (/to|thur|th/g) { ...}
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP