免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2104 | 回复: 6
打印 上一主题 下一主题

[其他] c 正则表达式怎样只提取内部链接? [复制链接]

论坛徽章:
1
IT运维版块每日发帖之星
日期:2015-12-20 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-10-26 11:14 |只看该作者 |倒序浏览
现在一个网页想只提取其中的内部链接,网页的链接形式有:
<a href="www.baidu.com/....."></a>
<a href="xxxx.htm"></a>
<a href="a/b/c.htm"></a>
<a href="#"></a>
怎样只提取第2,3中形式的链接?求个c的正则表达式

论坛徽章:
1
IT运维版块每日发帖之星
日期:2015-12-20 06:20:00
2 [报告]
发表于 2012-10-26 11:47 |只看该作者
自己顶。。。

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
3 [报告]
发表于 2012-10-26 11:58 |只看该作者
取中间两个连接的意思吗?

论坛徽章:
1
IT运维版块每日发帖之星
日期:2015-12-20 06:20:00
4 [报告]
发表于 2012-10-26 14:14 |只看该作者
就是只取某个站点目录下的链接,而那些指向外部站点的不提取

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
5 [报告]
发表于 2012-10-26 15:10 |只看该作者
那我必须提醒你, 你这些链接全是站内链, 就算第一个你也弄错了, 应该是"http://www.baidu.com"

论坛徽章:
1
IT运维版块每日发帖之星
日期:2015-12-20 06:20:00
6 [报告]
发表于 2012-10-26 19:05 |只看该作者
我只是举个列子。。。

论坛徽章:
59
2015年亚洲杯之约旦
日期:2015-01-27 21:27:392015年亚洲杯之日本
日期:2015-02-06 22:09:41拜羊年徽章
日期:2015-03-03 16:15:432015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015元宵节徽章
日期:2015-03-06 15:50:392015年亚洲杯之阿联酋
日期:2015-03-19 17:39:302015年亚洲杯之中国
日期:2015-03-23 18:52:23巳蛇
日期:2014-12-14 22:44:03双子座
日期:2014-12-10 21:39:16处女座
日期:2014-12-02 08:03:17天蝎座
日期:2014-07-21 19:08:47
7 [报告]
发表于 2012-10-26 20:05 |只看该作者
回复 3# linux_c_py_php


    四个都有可能吧

用正则比较麻烦。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP