免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 17317 | 回复: 7
打印 上一主题 下一主题

wget如何下载一个网页中的图片 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-01-04 23:16 |只看该作者 |倒序浏览
本帖最后由 kingoftime3 于 2011-01-08 10:09 编辑

比如http://pp.baidu.com中的
用wget -A jpg http://pp.baidu.com不行

在ziyunfei兄的提示下,终于弄出来了,原来pp.baidu.com虽然不登陆,还是会检查cookie的
首先,生成cookie文件
wget --save-cookies=cookie.baidu --keep-session-cookies http://hi.baidu.com/sys/album/login?type=new

http://hi.baidu.com/sys/album/login?type=new这个URL可以在html里找到,这样就将一些键值保存在cookie.baidu文件里了

这样就可以依据这个cookie下载图片了
wget -m -H -nd -l 1 -t 1 -A=html,jpg -e robots=off --load-cookies=cookie.baidu --keep-session-cookies http://pp.baidu.com

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
2 [报告]
发表于 2011-01-05 12:38 |只看该作者
最大的一个错误。没有cookies

你试试删除浏览器的cookies,还能上http://pp.baidu.com/吗。

论坛徽章:
0
3 [报告]
发表于 2011-01-05 13:23 |只看该作者
wget <图片URL>

论坛徽章:
0
4 [报告]
发表于 2011-01-05 14:10 |只看该作者
本帖最后由 kingoftime3 于 2011-01-05 14:13 编辑

回复 2# ziyunfei


    可以呀,我知道你说的意思,但我是要下载公共首页上的几张图片,先不考虑cookie,由于pp.baidu.com首页上的图片地址都是http:/ /hiphotos.baidu.com / du%CF%E0%B2%E1%D0%A1%B1%E0/pic/item/6512ad1bb01e2741314e1558.jpg就是和它不在一个目录下,所以wget下不到那些图片,wget会不会分析html把图片地址自动解析出来

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
5 [报告]
发表于 2011-01-05 15:08 |只看该作者
  1. 我用的是这个版本的wget  http://users.ugent.be/~bpuype/wget/

  2. wget --header="Cookie: BAIDUID=9520672A21AE5273541F74E132D8F6E1" -e robots=off -nd -A=html,jpg -m -l1 -H http://pp.baidu.com/

  3. 可以成功下载仅图片。

  4. 另外一个思路

  5. wget --header="Cookie: BAIDUID=9520672A21AE5273541F74E132D8F6E1" -O - http://pp.baidu.com/|grep URL|wget -i
复制代码

论坛徽章:
0
6 [报告]
发表于 2011-01-05 20:31 |只看该作者
回复 5# ziyunfei


    谢谢:)

论坛徽章:
0
7 [报告]
发表于 2011-01-08 01:01 |只看该作者
回复 5# ziyunfei


    还有一个问题,就是当一个图片的地址是***.php?id=123的时候怎么让wget跟踪这个php,解析出它所指的文件来

论坛徽章:
0
8 [报告]
发表于 2011-02-20 15:30 |只看该作者
回复 5# ziyunfei


    我非常想问一下,"Cookie: BAIDUID=9520672A21AE5273541F74E132D8F6E1"这个值是怎么弄出来的?我还没有这样批量下载过图片,以前一直是wget -nr -np -nd -A下载指定同一个目录下的图片。如果方便的话请能否告知,怎么知道什么情况需要cookie?
还望不吝赐教。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP