Chinaunix

标题: 正则贪婪匹配的问题 [打印本页]

作者: allen08pm    时间: 2014-02-07 17:54
标题: 正则贪婪匹配的问题
本帖最后由 allen08pm 于 2014-02-07 17:55 编辑

echo "Copyright 2003 and guess what?" | sed -r 's/^.*([0-9]+)/\1/g'
运行结果是 3 and guess what?   

为什么不是3

Any answer will be appreciated




作者: yestreenstars    时间: 2014-02-07 19:11
比较一下我这句和你的有什么差别:
  1. echo "Copyright 2003 and guess what?" | sed -r 's/^.*([0-9]+).*/\1/g'
复制代码

作者: allen08pm    时间: 2014-02-08 09:16
回复 2# yestreenstars

这个前后两个贪婪匹配  不怎么明白  大神能否解释下


   
作者: laliheyi    时间: 2014-02-08 13:21
本帖最后由 laliheyi 于 2014-02-08 13:22 编辑

回复 1# allen08pm
  1. echo "Copyright 2003 and guess what?" | sed -r 's/^.*([0-9]+)/\1/g'
复制代码
sed命令s替换匹配的字符 ^.*([0-9]+) 会匹配 "Copyright 2003 and guess what?"中的Copyright 2003(\1将为3)所以将之替换为3 ,与后面字符(and guess what?)组合结果就是所见到的3 and guess what?

   
作者: yestreenstars    时间: 2014-02-08 14:53
回复 3# allen08pm

Copyright 2003 and guess what?
黄色区域相当于.*
红色区域相当于([0-9]+)
你只对黄色和红色区域进行处理,而没对蓝色区域进行处理,所以最后的结果就是红色区域+蓝色区域,这样说你能理解吗?
   
作者: Herowinter    时间: 2014-02-08 16:16
回复 5# yestreenstars
楼主有疑问的应该是对于这段文本 Copyright 2003 and guess what?
正则 .*([0-9]+).*
为什么前一个.*匹配的是Copyright 200
后一个.*匹配的是 and guess what?

如果不是贪婪匹配的话,
理论上也可以前一个.*匹配Copyright
后一个.*匹配003 and guess what?
等等


   
作者: laliheyi    时间: 2014-02-08 16:48
回复 6# Herowinter


    我的理解是 贪婪匹配尽可能多的匹配,从左到右进行,第一个.*贪婪匹配到Copyright 200,([0-9]+)匹配到3 ...
作者: rogantianwz    时间: 2014-02-08 16:48
无语了,这根本就不关乎什么“贪婪匹配”的事,2楼是正解
作者: jeffreyst    时间: 2014-02-09 11:32
学习了,呵呵!
作者: elu_ligao    时间: 2014-02-09 12:11
只匹配到最后一个数字之前的所有,最后一个数字之后的没在你的匹配范围内,后面加.*可以
作者: three_body    时间: 2014-02-21 13:16
"Copyright 2003 and guess what?" | sed -r 's/^.*([0-9]+)/\1/g'

整个的语法含义是\1标签的值替换^.*([0-9]+)匹配的值。所以这里看看^.*([0-9]+)匹配的文本内容是Copyright 2003

\1标签的值是3,所以"Copyright 2003 and guess what?" 用3替换Copyright 2003后就是3 and guess what?。

同样,正则变成^.*([0-9]+).*后,它匹配的文本内容是Copyright 2003 and guess what?,用\1标签的值3替换Copyright 2003 and guess what?内容后,就是3了。





欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2