免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5127 | 回复: 12
打印 上一主题 下一主题

请问怎么下载网页上验证码的图片~ [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-08-13 14:36 |只看该作者 |倒序浏览
我想下载页面上的验证码图片 发现不行
import urllib


#here's how to download a file and save it remotely with urllib
fileUrl = 'http://tieba.baidu.com/cgi-bin/genimg?3134313535383239353435353330333431333439363637313930303030303030303030303030303132313836303930323764718C9ECE0AEC80BE2EF39631911F34'
urlStream = urllib.urlretrieve(fileUrl, 'test.jpg')

那个fileUrl地址是从网页上严重码的图片属性中直接取出的 发现下载后图片没有预览 就是没有下载成功 这个是百度贴吧的验证码 试了几个都不行 望高手指点一下 谢谢

论坛徽章:
0
2 [报告]
发表于 2008-08-13 14:44 |只看该作者
你把具体哪个页面有验证码的给偶看下,呵呵。
我找了一圈也没看到哪儿有验证码的唉。

论坛徽章:
0
3 [报告]
发表于 2008-08-13 14:51 |只看该作者
http://tieba.baidu.com/f?ct=& ... %E5%B2%D9&tb=on 就以贴吧的体操为例子吧
你点下标题栏 那个验证码就出来了

论坛徽章:
0
4 [报告]
发表于 2008-08-13 14:51 |只看该作者
用urllib2.Request发个referer和user-agent试试

论坛徽章:
0
5 [报告]
发表于 2008-08-13 14:55 |只看该作者
http://tieba.baidu.com/cgi-bin/g ... 0EE81C0895A1D28AB2A

这地址本身就无法直接讨问到啊

论坛徽章:
0
6 [报告]
发表于 2008-08-13 14:58 |只看该作者
原帖由 9119111 于 2008-8-13 14:55 发表
http://tieba.baidu.com/cgi-bin/g ... 0EE81C0895A1D28AB2A

这地址本身就无法直接讨 ...

刚开始应该是可以的 这个应该是个动态的 但一段时间内应该是可以的 如果刷新了网页就不行了

论坛徽章:
0
7 [报告]
发表于 2008-08-13 15:03 |只看该作者

  1. import urllib2

  2. r=urllib2.Request('http://tieba.baidu.com/cgi-bin/genimg?3135313630383433363838393935373935363335313537313334303030303030303030303030303031323138363130343636E4F886A9DAF430EE81C0895A1D28AB2A',headers={'referer':'http://tieba.baidu.com/f?kz=1234567890','user-agent':'Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.0.1) Gecko/2008070208 Firefox/3.0.1'})

  3. fp=open('test.jpeg','wb')

  4. for  k in urllib2.urlopen(r):
  5.       fp.write(k)
复制代码

论坛徽章:
0
8 [报告]
发表于 2008-08-13 15:05 |只看该作者
原帖由 3227049 于 2008-8-13 15:03 发表

import urllib2

r=urllib2.Request('http://tieba.baidu.com/cgi-bin/genimg?3135313630383433363838393935373935363335313537313334303030303030303030303030303031323138363130343636E4F886A9DAF430EE81 ...

我日 神奇   写了个头就可以了 这个是什么原因呢

论坛徽章:
0
9 [报告]
发表于 2008-08-13 15:06 |只看该作者
7楼 谢拉

论坛徽章:
0
10 [报告]
发表于 2008-08-13 15:07 |只看该作者
试试:urllib.urlretrieve(url, filename)
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP