免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2568 | 回复: 2
打印 上一主题 下一主题

如何通过HttpURLConnection得到搜索引擎的所有结果? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-03-05 20:23 |只看该作者 |倒序浏览
我想得到百度的所有搜索结果,然后把结果存在文件中,进行进一步处理,但是我只得到搜索结果的第一页内容,请问如何得到所有结果?
程序如下:请各位高手指点,谢谢!
HttpURLConnection conn = (HttpURLConnection)new URL("http://www.baidu.com/baidu?word=郑州大学").openConnection();

BufferedReader r = new BufferedReader(new InputStreamReader(conn.getInputStream()));

FileWriter w = new FileWriter("C:/index.html");

String text;
while((text = r.readLine()) != null)
{
System.out.println(text);
w.write(text,0,text.length());
}

w.close();
r.close();

论坛徽章:
0
2 [报告]
发表于 2008-03-06 10:11 |只看该作者
请各位高手支持一下,谢谢!

论坛徽章:
0
3 [报告]
发表于 2008-03-06 17:06 |只看该作者
1、查找百度是否有提供对外公布的接口
2、自己根据第一次返回结果去解析下一页结果的链接,这个办法笨一点
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP