免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1971 | 回复: 7

Regular Expressions Matches [复制链接]

论坛徽章:
0
发表于 2008-11-08 11:17 |显示全部楼层
一、djkfdj<dkcid%<00788JJKKKKKjkjdkfjdk>jkdjkf>jdkj

使用grep命令如何才能只匹配到以上红色部分。
其它命令也可以。

二、updaydaydayisdaydaydaydown

使用grep命令如何才能匹配到第一个day(或者是最后一个day)
其它命令也可以。

三、哪位达人能具体解释一下正则表达式的贪婪性。
谢谢!

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
发表于 2008-11-08 11:34 |显示全部楼层
原帖由 yezhulin1982 于 2008-11-8 11:17 发表
一、djkfdjjdkj

使用grep命令如何才能只匹配到以上红色部分。
其它命令也可以。

二、updaydaydayisdaydaydaydown

使用grep命令如何才能匹配到第一个day(或者是最后一个day)
其它命令也可以。

三、 ...


1、sed -r 's/.*%<([^>]+)>.*/\1/'
2、(1)将第一个day替换成   111   sed 's/day/111/'
     (2)将最后一个day替换成 111   sed -r 's/(.*)day/\1111/'
3、贪婪性就是会尽可能多的匹配,如2-(2)中的.*,会贪婪,所以day会匹配最后一个。

论坛徽章:
0
发表于 2008-11-08 11:54 |显示全部楼层

回复 #2 ly5066113 的帖子

thx!
那如何限制RE的贪婪性呢?
有些资料上讲到在"*"、"+"、"?"、"{}"这些具有贪婪性的正则表达式的元字符后面加一个"?"贪婪限制符来使匹配变得“惰性”,但是在本人的系统环境中测试无效。
如:
abbbbbbbb
$ egrep 'a.+?b' #使用了"?"贪婪限制符
abb

但是在我的系统环境中结果为:
abbbbbbbb #还是最长(贪婪)匹配


系统环境:
Debian GNU/Linux Testing
Linux debian 2.6.26-1-686 #1 SMP Thu Oct 9 15:18:09 UTC 2008 i686
GNU/LinuxGNU bash, version 3.2.39(1)-release (i486-pc-linux-gnu)
GNU grep 2.5.3

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
发表于 2008-11-08 12:06 |显示全部楼层
原帖由 yezhulin1982 于 2008-11-8 11:54 发表
thx!
那如何限制RE的贪婪性呢?
有些资料上讲到在"*"、"+"、"?"、"{}"这些具有贪婪性的正则表达式的元字符后面加一个"?"贪婪限制符来使匹配变得“惰性”,但是在本人的系统环境中测试无效。
如:
abbbbbbbb ...


每个工具的正则或多或少都有些差别,不能看到了就以为通用。
.+?这种正则在perl中是可用的,在grep、sed、awk中都不可用。

论坛徽章:
0
发表于 2008-11-08 12:21 |显示全部楼层

回复 #4 ly5066113 的帖子

understood!

论坛徽章:
0
发表于 2008-11-08 12:26 |显示全部楼层

回复 #2 ly5066113 的帖子

根据你
2、(1)将第一个day替换成   111   sed 's/day/111/'
  (2)将最后一个day替换成 111   sed -r 's/(.*)day/\1111/'

运行后的结果:
    (1)[xfm@debian:~]$ sed 's/day/111/' jj.txt
       up111 daydayisdayday daydown

    (2)[xfm@debian:~]$ sed -r 's/(.*)day/\1111/' jj.txt
       upday daydayisdayday 111down

不是很明白???

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
发表于 2008-11-08 13:19 |显示全部楼层
  1. 1 $ cat ii.txt
  2. djkfdj<dkcid%<00788JJKKKKKjkjdkfjdk>jkdjkf>jdkj

  3. $ grep -Eo "[0-9]+[^>]+" ii.txt
  4. 00788JJKKKKKjkjdkfjdk

  5. 2 $cat jj.txt
  6. up1daydaydayisdayday2daydown

  7. $ sed 's/\(.day\).*/\1/;s/.*\(.day\)/\1/' jj.txt                  
  8. 1day

  9. $ sed 's/.*\(.day\).*/\1/' jj.txt
  10. 2day
复制代码

论坛徽章:
0
发表于 2008-11-08 15:25 |显示全部楼层

回复 #7 ynchnluiti 的帖子

thx
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP