免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4788 | 回复: 9
打印 上一主题 下一主题

(sed)正则表达式问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-09-12 19:03 |只看该作者 |倒序浏览
echo 'aaa:2008<hr><br>aaa:2009<hr><br>' | sed 's/.*:\([^<]*\).*/\1/'

2009

echo 'aaa:2008<hr><br>aaa:2009<hr><br>' | sed 's/[^:]*\([^<]*\).*/\1/'

:2008

这里的正则结果为什么会出现 : ,现在只需要第一个 : <hr>之间的字符。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2007-09-12 19:15 |只看该作者
echo 'aaa:2008<hr><br>aaa:2009<hr><br>' | sed 's/.*:\(.*\)<hr>.*:.*/\1/'

论坛徽章:
0
3 [报告]
发表于 2007-09-12 22:43 |只看该作者
我现在就是想懂明白,正则表达式贪婪与非贪婪的问题。

书上说[^<]这样可以非贪婪,但不明白[^:]结果为什么会有个:

论坛徽章:
0
4 [报告]
发表于 2007-09-12 22:49 |只看该作者
因为正则表达式有最长匹配的特性

论坛徽章:
0
5 [报告]
发表于 2007-09-12 22:59 |只看该作者
echo 'aaa:2008<hr><br>aaa:2009<hr><br>' | sed 's/[^:]*:\([^<]*\).*/\1/'

论坛徽章:
0
6 [报告]
发表于 2007-09-13 00:06 |只看该作者
我的理解是
[^:]*  为非: 字符的0个或者多个,所以一直到第一个:aaa,所以就出现了: ,后面的[^<]为非<字符的0个或者多个,所以就匹配第一个<之前的内容2008,因为只需要“2008”所以后面再加上一个.*

论坛徽章:
0
7 [报告]
发表于 2007-09-13 12:28 |只看该作者

回复

6楼理解正确了!呵呵

论坛徽章:
0
8 [报告]
发表于 2007-09-13 16:32 |只看该作者
sed 's/^[^0-9]*\([0-9]\+\).*/\1/'

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
9 [报告]
发表于 2007-09-13 16:39 |只看该作者
原帖由 ideaz 于 2007-9-13 00:06 发表
我的理解是
[^:]*  后面的[^<]为非<字符的0个或者多个,所以就匹配第一个<之前的内容2008


后面的[^<]为非<字符的0个或者多个,所以就匹配第一个<之前的内容:2008
:也是[^<]

论坛徽章:
0
10 [报告]
发表于 2007-09-13 16:54 |只看该作者
echo 'aaa:2008<hr><br>aaa:2009<hr><br>' | sed 's/^.*\:\(....\).*/\1/'

不知道我这样的写法严谨不?请大家多多指教。谢谢。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP