Chinaunix
标题:
如何用wget来取cdn节点缓存的文件?
[打印本页]
作者:
sunfeng116
时间:
2011-05-16 17:19
标题:
如何用wget来取cdn节点缓存的文件?
如题
作者:
sunfeng116
时间:
2011-05-16 17:20
主要是想看节点是不是更新过
作者:
where27
时间:
2011-05-16 17:40
先wget一次,会生成一个文件,然后sleep 一会,再wget一次生成一个文件,用diff对比两个文件
作者:
sunfeng116
时间:
2011-05-16 17:54
不是这个意思
比如说 我用wget -S --spider
www.XXX.com/index.html
去查http头部信息,返回一下信息
正在解析主机
www.XXX.com...
124.160.239.251
正在连接
www.XXX.com
|124.160.239.251|:80... 已连接。
已发出 HTTP 请求,正在等待回应...
HTTP/1.0 200 OK
Content-Type: text/html
Accept-Ranges: bytes
ETag: "3334747604"
Last-Modified: Fri, 13 May 2011 10:57:12 GMT
Content-Length: 11236
Date: Sun, 15 May 2011 02:34:10 GMT
Server: lighttpd/1.4.26
Age: 11080
X-Via: 1.0 hzxs242:8887 (Cdn Cache Server V2.0)
Connection: keep-alive
长度: 11236 (11K) [text/html]
这个是从cdn节点上取的页面
如果我直接用ip地址去取的话,wget -S --spider 124.160.239.251/XXX.com/index.html 无法正常响应
这个是什么原因?或者说怎么直接去下载cdn节点上缓存的页面?
作者:
where27
时间:
2011-05-16 18:06
回复
4#
sunfeng116
www.XXX.com/index.html
对应的应该是124.160.239.251/index.html吧,是不是写错了
作者:
ziyunfei
时间:
2011-05-16 19:17
一个ip对应多个网站
只告诉人家ip,给你返回哪个网站.
这种情况
如果自己构造请求
必须告诉在HOST header 里告诉人家你想要的域名
$ua->default_header("Host"=>"www.dlmu.edu.cn");
my $response = $ua->get("http://202.118.88.88/");
wget 的话 是这样
wget --header="Host:
www.dlmu.edu.cn
" -qO- "http://202.118.88.88/"
你拿浏览器输入
http://202.118.88.88/
的话,HOST头是202.118.88.88,反回400
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2