Chinaunix
标题:
正则贪婪匹配的问题
[打印本页]
作者:
allen08pm
时间:
2014-02-07 17:54
标题:
正则贪婪匹配的问题
本帖最后由 allen08pm 于 2014-02-07 17:55 编辑
echo "Copyright 2003 and guess what?" | sed -r 's/^.*([0-9]+)/\1/g'
运行结果是 3 and guess what?
为什么不是3
Any answer will be appreciated
作者:
yestreenstars
时间:
2014-02-07 19:11
比较一下我这句和你的有什么差别:
echo "Copyright 2003 and guess what?" | sed -r 's/^.*([0-9]+).*/\1/g'
复制代码
作者:
allen08pm
时间:
2014-02-08 09:16
回复
2#
yestreenstars
这个前后两个贪婪匹配 不怎么明白 大神能否解释下
作者:
laliheyi
时间:
2014-02-08 13:21
本帖最后由 laliheyi 于 2014-02-08 13:22 编辑
回复
1#
allen08pm
echo "Copyright 2003 and guess what?" | sed -r 's/^.*([0-9]+)/\1/g'
复制代码
sed命令s替换匹配的字符 ^.*([0-9]+) 会匹配 "Copyright 2003 and guess what?"中的Copyright 2003(\1将为3)所以将之替换为3 ,与后面字符(and guess what?)组合结果就是所见到的3 and guess what?
作者:
yestreenstars
时间:
2014-02-08 14:53
回复
3#
allen08pm
Copyright 200
3
and guess what?
黄色区域相当于.*
红色区域相当于([0-9]+)
你只对黄色和红色区域进行处理,而没对蓝色区域进行处理,所以最后的结果就是红色区域+蓝色区域,这样说你能理解吗?
作者:
Herowinter
时间:
2014-02-08 16:16
回复
5#
yestreenstars
楼主有疑问的应该是对于这段文本 Copyright 2003 and guess what?
正则 .*([0-9]+).*
为什么前一个.*匹配的是Copyright 200
后一个.*匹配的是 and guess what?
如果不是贪婪匹配的话,
理论上也可以前一个.*匹配Copyright
后一个.*匹配003 and guess what?
等等
作者:
laliheyi
时间:
2014-02-08 16:48
回复
6#
Herowinter
我的理解是 贪婪匹配尽可能多的匹配,从左到右进行,第一个.*贪婪匹配到Copyright 200,([0-9]+)匹配到3 ...
作者:
rogantianwz
时间:
2014-02-08 16:48
无语了,这根本就不关乎什么“贪婪匹配”的事,2楼是正解
作者:
jeffreyst
时间:
2014-02-09 11:32
学习了,呵呵!
作者:
elu_ligao
时间:
2014-02-09 12:11
只匹配到最后一个数字之前的所有,最后一个数字之后的没在你的匹配范围内,后面加.*可以
作者:
three_body
时间:
2014-02-21 13:16
"Copyright 2003 and guess what?" | sed -r 's/^.*([0-9]+)/\1/g'
整个的语法含义是\1标签的值替换^.*([0-9]+)匹配的值。所以这里看看^.*([0-9]+)匹配的文本内容是Copyright 2003
1.JPG
(28.57 KB, 下载次数: 25)
下载附件
2014-02-21 13:13 上传
\1标签的值是3,所以"Copyright 2003 and guess what?" 用3替换Copyright 2003后就是3 and guess what?。
同样,正则变成^.*([0-9]+).*后,它匹配的文本内容是Copyright 2003 and guess what?,用\1标签的值3替换Copyright 2003 and guess what?内容后,就是3了。
2.JPG
(29.29 KB, 下载次数: 21)
下载附件
2014-02-21 13:16 上传
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2