免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5808 | 回复: 16
打印 上一主题 下一主题

请教匹配图片地址的正则 [复制链接]

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-10-05 09:38 |只看该作者 |倒序浏览
<a href="/"><img src="images/default/logo.gif" alt="ChinaUnix.net" border="0"></a>

以这个为例,只要匹配images/default/logo.gif,<img />内部各个元素数量不等,位置不定,外部语境不定。引号有可能是双引号或单引号。src中有可能是“http://xxxx/xxx”或“/xxxx/xxx”或“xxxx/xxx”。图片格式不可知。
只需要正则

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
2 [报告]
发表于 2010-10-05 09:52 |只看该作者
本帖最后由 rdcwayx 于 2010-10-05 09:53 编辑

不全用正则。后面的继续。
  1. awk 'BEGIN{RS="<"}/img src/{print gensub(/^.....(.+).$/,"\\1","g",$2)}' infile
复制代码

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
3 [报告]
发表于 2010-10-05 09:58 |只看该作者
不全用正则。后面的继续。
rdcwayx 发表于 2010-10-05 09:52



    是这样,我这个需求是用在php里面的preg_match()函数,用正则是最简练的办法。
如果用别的办法也可以,最差我可以把文本中所有src冒泡筛出来,但那样太罗嗦。需要判断的东西也太多。
恳求犀利正则!

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
4 [报告]
发表于 2010-10-05 10:00 |只看该作者
是这样,我这个需求是用在php里面的preg_match()函数,用正则是最简练的办法。
如果用别的办法也 ...
昭襄王 发表于 2010-10-05 09:58



    另外,img和src不一定紧挨着,之间可能是alt等等。元素位置不固定。

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
5 [报告]
发表于 2010-10-05 11:24 |只看该作者
还在放假吗?

论坛徽章:
0
6 [报告]
发表于 2010-10-05 11:31 |只看该作者
会的都在放假,不会的都在灌睡

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
7 [报告]
发表于 2010-10-05 12:47 |只看该作者

会的赶快上班吧

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
8 [报告]
发表于 2010-10-06 11:22 |只看该作者
顶一下

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
9 [报告]
发表于 2010-10-07 08:42 |只看该作者

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
10 [报告]
发表于 2010-10-07 09:55 |只看该作者
  1. 内部各个元素数量不等,位置不定,外部语境不定。引号有可能是双引号或单引号。src中有可能是“http://xxxx/xxx”或“/xxxx/xxx”或“xxxx/xxx”。图片格式不可知
复制代码
什么都不确定,怎么写?
有什么是确定的?
况且又要求是PHP的正则,各种工具之间的正则表达式都有差别。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP