免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1075 | 回复: 0
打印 上一主题 下一主题

wget 为何只能抓取索引页的链接 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-11-11 10:27 |只看该作者 |倒序浏览
我发现wget有个不足之处,就是只能抓取有索引的连接,

比如:根目录 www.abc.com 中有 index.html   a.html  b.html ,其中index.html中有a.html的连接,但没有b.html的连接, a.html 也不包含b.html的连接, 我用 wget -r http://www.abc.com ,结果是index.html 和 a.html 抓下来了,b.html抓不到!

如果一个网站的索引页不包含任何内部连接,而把连接做到flash或java里面,wget 只能抓取索引页,对目录中的其他文件和子目录,就象瞎子一样,毫无办法!我用flashget的“站点探索器”,发现它的原理和wget一样!

我学识浅薄,对此也毫无办法!不知列位学友有没有研究过?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP