免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1832 | 回复: 1
打印 上一主题 下一主题

新手请教一个正则表达式的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-11-16 17:36 |只看该作者 |倒序浏览
有一行字符串如下:
<lex pos=DT>The</lex> <lex pos=JJ>fifty-third</lex> <lex pos=NN>session</lex> <lex pos=IN>of</lex> <lex pos=DT>the</lex> <lex pos=NN>Committee</lex> <lex pos=IN>on</lex> <lex pos=NNS>Contributions</lex> <lex pos=VBD>was</lex> <lex pos=VBN>held</lex> <lex pos=IN>at</lex> <lex pos=NNP>United</lex> <lex pos=NNPS>Nations</lex> <lex pos=NNP>Headquarters</lex> <lex pos=IN>from</lex> <TIMEX2 TYPE="DATE"><lex pos=CD>14</lex> <lex pos=NNP>June</lex></TIMEX2> <lex pos=TO>to</lex> <TIMEX2 TYPE="DATE"><lex pos=CD>2</lex> <lex pos=NNP>July</lex> <lex pos=CD>1993</lex></TIMEX2> <lex pos=.>.</lex>~
能否只抽取出这两个:
<TIMEX2 TYPE="DATE"><lex pos=CD>14</lex> <lex pos=NNP>June</lex></TIMEX2>
<TIMEX2 TYPE="DATE"><lex pos=CD>2</lex> <lex pos=NNP>July</lex> <lex pos=CD>1993</lex></TIMEX2>
简单来说,就是如何把满足模式的所有串(上面例子中只有两个满足模式的串)都找出来?

论坛徽章:
0
2 [报告]
发表于 2010-11-17 00:26 |只看该作者
本帖最后由 DIYBYPERL 于 2010-11-17 15:22 编辑
  1. $str='<lex pos=DT>The</lex> <lex pos=JJ>fifty-third</lex> <lexpos=NN>session</lex> <lex pos=IN>of</lex> <lexpos=DT>the</lex> <lexpos=NN>Committee</lex> <lex pos=IN>on</lex> <lex pos=NNS>Contributions</lex> <lex pos=VBD>was</lex> <lex pos=VBN>held</lex> <lex pos=IN>at</lex> <lexpos=NNP>United</lex> <lex pos=NNPS>Nations</lex> <lexpos=NNP>Headquarters</lex> <lex pos=IN>from</lex> <TIMEX2 TYPE="DATE"><lexpos=CD>14</lex> <lex pos=NNP>June</lex></TIMEX2> <lex pos=TO>to</lex> <TIMEX2TYPE="DATE"><lex pos=CD>2</lex> <lex pos=NNP>July</lex> <lexpos=CD>1993</lex></TIMEX2> <lex pos=.>.</lex>~';
  2. @r= $str=~m/<TIMEX.*?<\/TIMEX2>/sg;
  3. print $_,"\n" for (@r);
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP