免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3706 | 回复: 5
打印 上一主题 下一主题

google搜索LWP下载图片超时跳过 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-08-29 17:39 |只看该作者 |倒序浏览
  1. use Google::Search;
  2. use LWP::UserAgent;
  3. my $query='美女';
  4. my $ua = LWP::UserAgent->new;
  5. $ua->timeout(15);

  6. my $search = Google::Search->Image( query => $query );
  7. while ( my $result = $search->next ) {
  8.     my $url = $result->uri;
  9.     my $name = ( split( '/', $url ) )[-1];
  10.     if ( $name !~ /%/ ) {
  11.         $name = substr( $name, -10 );
  12.         open FILE,">$name" or die "$!";
  13.         my $out=get_image($ua,$url);
  14.         binmode(FILE);
  15.         print FILE $out;
  16.     }
  17. }

  18. sub get_image {
  19.     my ($ua,$url)=@_;
  20.     my $response = $ua->get($url);
  21.     return $response->decoded_content if $response->is_success;
  22.     return undef;
  23. }
复制代码

论坛徽章:
0
2 [报告]
发表于 2011-08-29 18:55 |只看该作者
不错。

return $response->decoded_content if $response->is_success;
return undef;


改成:
  1. return $response->is_success ? $response->decoded_content : ();
复制代码
更清爽。

论坛徽章:
0
3 [报告]
发表于 2011-08-30 08:40 |只看该作者
控制超时 简单的设定个 timeout 是不够的

要是有个图片大小是1G 而每秒只能下载1k 你这个程序是无法控制的

论坛徽章:
0
4 [报告]
发表于 2011-09-01 10:47 |只看该作者
搭车问个LWP的timeout问题

如果远端的web server挂掉了,这个时候,设置timetout似乎没有作用,TCP连接一直处于SYN_SEND的状态,直到180秒后才超时退出。

怎么处理设置这种超时时间?

论坛徽章:
0
5 [报告]
发表于 2011-09-01 11:19 |只看该作者
搭车问个LWP的timeout问题

如果远端的web server挂掉了,这个时候,设置timetout似乎没有作用,TCP连接一 ...
infernor 发表于 2011-09-01 10:47



    与操作系统有关吧。设置tcp_syn_timeout 之类。

论坛徽章:
0
6 [报告]
发表于 2012-08-31 15:49 |只看该作者
回复 2# 兰花仙子

仙子,如果不是 google::search->Image, 而是Google::Search->Web,

想要把 关键词的搜索的结果(好多页)输出到一个文本中

该怎么弄?

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP