免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2944 | 回复: 3
打印 上一主题 下一主题

[求助]抓取网页内容时被禁要怎么办 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-03-14 21:49 |只看该作者 |倒序浏览

  1. 1 #!/usr/bin/perl -w
  2.   2 use LWP;
  3.   3 use Encode qw/from_to decode encode/;
  4.   4 use strict;
  5.   5
  6.   6 my $ua = LWP::UserAgent->new;
  7.   7 $ua->cookie_jar({-file=>"./cookie"});
  8.   8 $ua->proxy(['http'],'http://10.71.115.253:3128');
  9.   9 my $url = 'http://news.google.cn/news?hl=zh-CN&ned=ccn&ie=UTF-8&q=%E7%94%9F%E7%89%A9&as_drrb=q&as_qdr=h';
  10. 10 my $page = $ua->get($url);
  11. 11
  12. 12
  13. 13 print $page->content;

复制代码


就上面的url='http://news.google.cn/news?hl=zh-CN&ned=ccn&ie=UTF-8&q=%E7%94%9F%E7%89%A9&as_drrb=q&as_qdr=h',是google旗下的一个网页,
抓它时,内容部分显示:
<H1>Forbidden</H1>
Your client does not have permission to get URL <code>/news?hl=zh-CN&amp;ned=ccn&amp;ie=UTF-8&amp;q=%E7%94%9F%E7%89%A9&amp;as_drrb=q&amp;as_qdr=h</code> from this server.
这要怎么办呀,求助达人解答

论坛徽章:
0
2 [报告]
发表于 2008-03-14 22:03 |只看该作者
顶下

论坛徽章:
0
3 [报告]
发表于 2008-03-15 14:54 |只看该作者
问题已解决。。。只要把代码写在浏览在访问就行了

论坛徽章:
0
4 [报告]
发表于 2008-03-15 22:42 |只看该作者
原帖由 chenxiam 于 2008-3-15 14:54 发表
问题已解决。。。只要把代码写在浏览在访问就行了

可以看看代码吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP