免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1985 | 回复: 4
打印 上一主题 下一主题

使用HTML::LinkExtor中的parse函数无法获得<option></option>中的链接 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-10-14 21:53 |只看该作者 |倒序浏览
比如这样的html代码:
<option value="http://www.chinaunix.net/">chinaunix</option>

用HTML::LinkExtor中的parse似乎无法分析出option这个字. 从而也就无法获得里面的value字段.
请问这种问题应当如何解决?

论坛徽章:
0
2 [报告]
发表于 2006-10-14 22:03 |只看该作者
万金油 正则

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
3 [报告]
发表于 2006-10-14 22:45 |只看该作者
晕~
option 的 value 又不是链接,只是个字符串。
HTML::LinkExtor 只解析链接。

建议阅读 HTML 语法先。

论坛徽章:
0
4 [报告]
发表于 2006-10-14 23:20 |只看该作者
原帖由 flw 于 2006-10-14 22:45 发表
晕~
option 的 value 又不是链接,只是个字符串。
HTML::LinkExtor 只解析链接。

建议阅读 HTML 语法先。


那么有没有方法可以解决这种情况啊?
其实这是一个课后作业: 做一个简单的spider.
这样的"链接"应当也是在spider的提取范围内的吧.

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
5 [报告]
发表于 2006-10-14 23:34 |只看该作者
原帖由 pspspsps 于 2006-10-14 23:20 发表

那么有没有方法可以解决这种情况啊?
其实这是一个课后作业: 做一个简单的spider.
这样的"链接"应当也是在spider的提取范围内的吧.

那看你怎么理解,我认为:不在。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP