免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1951 | 回复: 1
打印 上一主题 下一主题

Perl怎么抓取一个网页的所有URL [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-05-21 12:29 |只看该作者 |倒序浏览
记得以前写过一个Demo,好久不用perl,忘记丢哪了 ..
#!/usr/bin/perl


use strict;
use warnings;
use LWP;

my $url="http://www.baidu.com";

my $browser=LWP::UserAgent->new;
my $new_agent='Mozilla/5.0';
$browser->agent($new_agent);

my $response=$browser->get($url);
print $response->content;

好像有个叫啥 Links的模块, 好像是这名字, 可以直接获取到 $response->content 中的所有URL 链接.. 问下是哪个模块..

论坛徽章:
0
2 [报告]
发表于 2009-05-21 12:40 |只看该作者
HTML::LinkExtractor
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP