免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1851 | 回复: 4
打印 上一主题 下一主题

如何用shell抓取squid代理服务器后的webserver网页 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-01 12:41 |只看该作者 |倒序浏览
比较http://www.sohu.com/ 这个页面在同一时间的大小,该域名有多个IP,如果发现这个页面的大小不一样的时候,输出一个错误的符号。脚本实现

晕啊,这个问题没什么思路了

开始想得,获得www.sohu.com这个域名的所有主机IP,然后分别获得每个主机上的页面就可以了,实践表明,这个思路貌似不可取。www.sohu.com的web应用使用了squid反向代理,根本没有办法获得squid代理服务器后的webserver的页面。

怎末搞呢???各位有没有什么思路说一下哈,先谢谢了

[ 本帖最后由 drinkey 于 2008-6-1 18:56 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-06-01 18:57 |只看该作者
没人理啊。。。郁闷,很急啊

论坛徽章:
0
3 [报告]
发表于 2008-06-02 10:18 |只看该作者
给个思路:先用host www.sohu.com获得IP列表,然后修改你的/etc/hosts文件为222.73.123.8 www.sohu.com,然后抓取文件,然后再改/etc/hosts文件为222.73.123.17 www.sohu.com直到IP列表结束。

论坛徽章:
0
4 [报告]
发表于 2008-06-02 13:33 |只看该作者
恩,呵呵,太感谢了,茅塞顿开

谢谢你了!!

论坛徽章:
0
5 [报告]
发表于 2008-06-02 14:31 |只看该作者
获取某个域名的所有主机记录:


  1. dig 域名 | awk '$4=="A" && NF==5{print $NF}'
复制代码


例如:
dig www.sohu.com | awk '$4=="A" && NF==5{print $NF}'
222.28.152.144
222.28.152.146
222.28.152.149
222.28.152.157
222.28.152.158
222.28.152.133
222.28.152.134
222.28.152.135
222.28.152.136
222.28.152.141
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP