免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1810 | 回复: 3

【请教】通过正则表达式处理多行的问题 [复制链接]

论坛徽章:
0
发表于 2013-03-06 23:59 |显示全部楼层
本帖最后由 li_haigang 于 2013-03-07 00:03 编辑

下面的内容,如何通过正则表达式匹配实现以下逻辑:
检索到红色部分后打印出绿色部分,即weight值为数字+吨,便打印其上几行中的“/d1/d2/d3/123456”部分。而weight值为“空”,则不打印其上的“/d1/d2/d3/123457”。




-------------下面是待分析的文本---------------------



<div class="entryContent left" style="min-height:92px;">
<p style="margin:28px; width: 480px;"><a href="/d1/d2/d3/123456">hello world.</a></p>
</div>
<div class="entryInfo right">

<p class="weight">3吨</p>

</div>
<div class="entryContent left" style="min-height:92px;">
<p style="margin:28px; width: 480px;"><a href="/d1/d2/d3/123457">hi.</a></p>
</div>
<div class="entryInfo right">

<p class="weight">空</p>

</div>

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
发表于 2013-03-07 08:57 |显示全部楼层
/(匹配绿色部分) .*? (匹配红色部分)  (?{print $1 if $2 !~ /空/})/sg
(?{}) 结构可以在正则表达式中插入代码在匹配过程中执行。

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34子鼠
日期:2013-12-14 14:57:19射手座
日期:2014-04-25 21:23:23
发表于 2013-03-07 10:22 |显示全部楼层
本帖最后由 mcshell 于 2013-03-07 10:23 编辑

回复 1# li_haigang
  1. perl -lne '$/=undef;1 while(/<a[^>]+=["]([^"]+)[\S\s]+?<p[^>]+weight["]>(\d+[^<]+)(?{print $1})/msg)' file
复制代码

论坛徽章:
0
发表于 2013-03-07 17:29 |显示全部楼层
本帖最后由 li_haigang 于 2013-03-07 17:30 编辑
zhlong8 发表于 2013-03-07 08:57
/(匹配绿色部分) .*? (匹配红色部分)  (?{print $1 if $2 !~ /空/})/sg
(?{}) 结构可以在正则表达式中插入 ...




2楼您好!

下面的正则表达式为何匹配不到需要的内容?
实际想要的内容为:/d1/d2/d3/123456。





strings =~ /(匹配绿色部分) .*? (匹配红色部分) /sg

print $1;
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP