免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 8801 | 回复: 14
打印 上一主题 下一主题

python抓网页似乎不如perl加lwp [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-07-29 15:50 |只看该作者 |倒序浏览
5可用积分
自己没事做个抓天气预报的东西,似乎用perl可以,用python返回不对,本来就是想着那个能完成用那个完成,自己用的,以前做linux其他的东西的时候简单看了点perl,感觉不如python舒服,太乱,准备以后用python。结果似乎perl实现的更好点,不清楚原因在那里
perl的

#!/usr/bin/perl -w
# use LWP::Simple;
use LWP::UserAgent;
use strict;
my $ua = new LWP::UserAgent;
$ua->timeout(120);
my $url='http://www.t7online.com/cgi-bin/citybild?SID=57181d5d2b95dd66d2e7e5ebb70cefe9b1e27&PROVIDER=anwendung&WMO=57181&LANG=cn';
my $request = new HTTP::Request('GET', $url);
my $response = $ua->request($request);
my $content = $response->content();
open(OUTPUT,'>>c:\\output.html')||die"can not open the file: $!";
print OUTPUT $content;
close (OUTPUT);

python的

import urllib2
request = urllib2.Request('http://www.t7online.com/cgi-bin/citybild?SID=57181d5d2b95dd66d2e7e5ebb70cefe9b1e27&PROVIDER=anwendung&WMO=57181&LANG=cn')
opener = urllib2.build_opener()
feeddata = opener.open(request).read()

python的总是得到 gif89a啥的,似乎是弄到了一个gif图的样子

也不清楚是怎么回事。

最佳答案

查看完整内容

import urllib2request = urllib2.Request('http://www.t7online.com/cgi-bin/citybild?SID=57181d5d2b95dd66d2e7e5ebb70cefe9b1e27&PROVIDER=anwendung&WMO=57181&LANG=cn')opener = urllib2.build_opener()opener.addheaders = [("User-agent","Mozilla/5.0")]feeddata = opener.open(request).read()

论坛徽章:
0
2 [报告]
发表于 2008-07-29 15:50 |只看该作者
原帖由 jmylf 于 2008-7-29 15:50 发表
自己没事做个抓天气预报的东西,似乎用perl可以,用python返回不对,本来就是想着那个能完成用那个完成,自己用的,以前做linux其他的东西的时候简单看了点perl,感觉不如python舒服,太乱,准备以后用python。 ...

import urllib2
request = urllib2.Request('http://www.t7online.com/cgi-bin/citybild?SID=57181d5d2b95dd66d2e7e5ebb70cefe9b1e27&PROVIDER=anwendung&WMO=57181&LANG=cn')
opener = urllib2.build_opener()
opener.addheaders = [("User-agent","Mozilla/5.0")]
feeddata = opener.open(request).read()

论坛徽章:
0
3 [报告]
发表于 2008-07-29 16:03 |只看该作者
打开这个页面后会自动跳转到另外的页面,把我IE搞死的了。。。。

抓天气预报可以去中央气象台或者tq121唉,你这个小站一起抓的时候立马歇菜了。

论坛徽章:
0
4 [报告]
发表于 2008-07-29 16:15 |只看该作者
我弄了个函数抓下来了,似乎是useragent的问题,中央气象台的我能抓到,这个也不错的

论坛徽章:
0
5 [报告]
发表于 2008-07-29 16:16 |只看该作者
不太喜欢perl,想以后就用python了,现在python可以就好了

论坛徽章:
0
6 [报告]
发表于 2008-07-29 16:55 |只看该作者
2楼的说话比较搞笑,

论坛徽章:
0
7 [报告]
发表于 2008-07-29 17:28 |只看该作者
搞笑??
哪里啊

论坛徽章:
0
8 [报告]
发表于 2008-07-29 21:32 |只看该作者
抓网页是Perl的强项啊。

论坛徽章:
0
9 [报告]
发表于 2008-07-29 21:46 |只看该作者
lz的问题有人搞好了没?我的结果跟lz一样

论坛徽章:
0
10 [报告]
发表于 2008-07-30 08:05 |只看该作者
差不多就是楼上的样子,需要加上user agent 才行。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP