免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: yueliangdao0608
打印 上一主题 下一主题

[数据]请问google里面搜索的时候那种分页是一次把数据取完,还是一次取一部分? [复制链接]

论坛徽章:
0
11 [报告]
发表于 2006-08-02 12:30 |只看该作者
原帖由 mikespook 于 2006-8-2 12:21 发表


通用数据库也可以用集群~~

google 使用的,如果我没记错应该是叫 Big File System 的东西,这个记录条数应该是统计值没错,不过应该还是采用了数据仓储的处理方式来做的。


复杂了,

论坛徽章:
0
12 [报告]
发表于 2006-08-02 13:58 |只看该作者
我想这个问题没有那么复杂,我觉得
1.google一直在用实用的技术
2.你用google测试一下最多可以搜索到多少页,对于数据库的返回量来说并不大。
3.既然如此,google为了解决这个问题可参考的方法就很多了,不过我仍然不能猜测,因为我不知到他的数据库设计.

论坛徽章:
0
13 [报告]
发表于 2006-08-02 18:22 |只看该作者
google,百度都是到100页以后就不提供了,说对服务器资源耗费太大。

论坛徽章:
0
14 [报告]
发表于 2006-08-02 21:16 |只看该作者
http://www.baselinemag.com/article2/0,1540,1985047,00.asp

How Google Works

其实用 Oracle 也能类似的实现 File System 。

论坛徽章:
0
15 [报告]
发表于 2006-08-03 10:09 |只看该作者
数据应该是分类,然后按数类分服务器。
根据你请求的结果条数来返回记录

论坛徽章:
0
16 [报告]
发表于 2007-06-05 17:26 |只看该作者

集群

GOOGLE服务器要是不用集群就奇怪了.......

论坛徽章:
62
2016科比退役纪念章
日期:2016-06-28 17:45:06奥兰多魔术
日期:2015-05-04 22:47:40菠菜神灯
日期:2015-05-04 22:35:07菠菜神灯
日期:2015-05-04 22:35:02NBA季后赛大富翁
日期:2015-05-04 22:33:34NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯纪念徽章
日期:2015-04-14 16:54:452015年亚洲杯之朝鲜
日期:2015-03-19 23:03:16明尼苏达森林狼
日期:2015-03-16 21:51:152015小元宵徽章
日期:2015-03-06 15:57:202015年迎新春徽章
日期:2015-03-04 09:55:282015年辞旧岁徽章
日期:2015-03-03 16:54:15
17 [报告]
发表于 2007-06-05 18:06 |只看该作者
所有的搜索引擎都不是直接采用数据库.  百度,google,yahoo其实都是同样的技术.

搜索都分为, 网页搜索和商业搜索, 一般在公司里面也是彻底分开的两个部门.网页搜索为根基, 然后靠商业搜索赚钱.

一般是网页搜索去取商业搜索的数据, 同时展现在页面上.   一般在200毫秒以内网页搜索取不到商业搜索的数据,

就直接全部是网页搜索.

[ 本帖最后由 北京野狼 于 2007-6-5 18:25 编辑 ]

论坛徽章:
62
2016科比退役纪念章
日期:2016-06-28 17:45:06奥兰多魔术
日期:2015-05-04 22:47:40菠菜神灯
日期:2015-05-04 22:35:07菠菜神灯
日期:2015-05-04 22:35:02NBA季后赛大富翁
日期:2015-05-04 22:33:34NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯纪念徽章
日期:2015-04-14 16:54:452015年亚洲杯之朝鲜
日期:2015-03-19 23:03:16明尼苏达森林狼
日期:2015-03-16 21:51:152015小元宵徽章
日期:2015-03-06 15:57:202015年迎新春徽章
日期:2015-03-04 09:55:282015年辞旧岁徽章
日期:2015-03-03 16:54:15
18 [报告]
发表于 2007-06-05 18:19 |只看该作者
网页搜索和商业搜索一般采用不同的技术,  因为数据量的不同.

网页搜索一般是使用文件做存储, 多级的索引, 以及前台多级的缓存, 多服务器集群, 每台机器不一定是同样的数据

商业搜索一般必须注重实时性,一般是多台机器集群, 每台机器同样的数据,  都是在内存中做.(当然原始的记录是在DB上)

[ 本帖最后由 北京野狼 于 2007-6-5 18:20 编辑 ]

论坛徽章:
0
19 [报告]
发表于 2007-06-05 21:11 |只看该作者
我晕,,有些同学还是先了解自己要说到,再回答哦。

google没用商业数据库。

论坛徽章:
62
2016科比退役纪念章
日期:2016-06-28 17:45:06奥兰多魔术
日期:2015-05-04 22:47:40菠菜神灯
日期:2015-05-04 22:35:07菠菜神灯
日期:2015-05-04 22:35:02NBA季后赛大富翁
日期:2015-05-04 22:33:34NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯纪念徽章
日期:2015-04-14 16:54:452015年亚洲杯之朝鲜
日期:2015-03-19 23:03:16明尼苏达森林狼
日期:2015-03-16 21:51:152015小元宵徽章
日期:2015-03-06 15:57:202015年迎新春徽章
日期:2015-03-04 09:55:282015年辞旧岁徽章
日期:2015-03-03 16:54:15
20 [报告]
发表于 2007-06-05 22:36 |只看该作者
原帖由 james.liu 于 2007-6-5 21:11 发表
我晕,,有些同学还是先了解自己要说到,再回答哦。

google没用商业数据库。



吹吹牛呗, 是人类的本性.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP