免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: zhangzhh05
打印 上一主题 下一主题

[算法] 对Google算法优越性的一点小体会 [复制链接]

论坛徽章:
0
181 [报告]
发表于 2008-06-26 15:55 |只看该作者
原帖由 wuxb45 于 2008-6-26 15:35 发表
我认为……匹配用户名的复杂度很低……主要是网络延迟占时间,这个速度快应该不是google的算法问题

匹配用户名只要毫秒及的就可以接受了,毕竟和网络延迟相比不算什么。用户完全可以接受。

论坛徽章:
0
182 [报告]
发表于 2008-06-26 16:21 |只看该作者
Mark...

评分

参与人数 1可用积分 -5 收起 理由
net_robber -5

查看全部评分

论坛徽章:
0
183 [报告]
发表于 2008-06-26 16:37 |只看该作者
原帖由 cx6445 于 2008-6-26 13:11 发表
google的三大基石

gfs,bigtable,map-reduce

相对应的开源产品

gfs:kfs(据传google创史人的同窗所创),hdfs(hadoop的子项目)
bigtable:hbase(hadoop的子项目),Hypertable(从hbase项目组分离出去的,用c++实现)
map-reduce:hadoop(apache的项目,java实现,目前创史人在yahoo全力打造,已有2000个以上的节点并行计算的规模)

其实大家都能去接触这些最前沿的东西。有工夫吵,不如去做做实验,看看源码。

mark一下google的三大基石对应的开源产品,有时间去看看~~

论坛徽章:
0
184 [报告]
发表于 2008-06-26 16:40 |只看该作者
我是个大一的孩子,看帖子看了一下午,什么都没看懂...

[ 本帖最后由 kkair001 于 2008-6-26 16:43 编辑 ]

论坛徽章:
0
185 [报告]
发表于 2008-06-26 16:41 |只看该作者
原帖由 zszyj 于 2008-6-26 14:21 发表

发现有些人的观点无异是强奸民意, 希望他们先弄清楚几个概念:
1. 我从开始至今, 一直强调的是, 象用户名匹配之类按索引查找的简单应用, 属于管理类信息, 适合用数据库. 可有些人偏偏视而不见, 非要将"网页", ...


我个人就觉得这个应用搞个mysql就好用了,只是有些人喜欢自己写而已,大家没冲突。

论坛徽章:
0
186 [报告]
发表于 2008-06-26 17:19 |只看该作者
原帖由 lose 于 2008-6-26 14:59 发表

id怎么不会時時做交易,前面的假设不就是同时有成千上万(同一时刻10000个请求)的人在检查10亿个已有用户名里是否存在,然后创建一万个新的用户名。




那只是用id 算出hash value, 跟據hash value , 去算出在那一台node上,的那筆record, 談不上transaction
請問你一旦某一筆 id field 會時常rename , delete , update ??

论坛徽章:
0
187 [报告]
发表于 2008-06-26 17:21 |只看该作者
原帖由 lose 于 2008-6-26 14:59 发表

id怎么不会時時做交易,前面的假设不就是同时有成千上万(同一时刻10000个请求)的人在检查10亿个已有用户名里是否存在,然后创建一万个新的用户名。




那只是用id 算出hash value, 跟據hash value , 去算出在那一台node上,的那筆record, 談不上transaction
請問你一旦某一筆 id field 會時常rename , delete , update ??

论坛徽章:
1
摩羯座
日期:2015-01-08 14:01:55
188 [报告]
发表于 2008-06-26 17:27 |只看该作者
原帖由 shan_ghost 于 2008-6-26 12:37 发表
对了,人家google还有个通过邮箱实时聊天的东东。假设设计目标仅仅是千万人同时在线,又需要什么样的数据库软硬件呢?


这个好用,超赞,web版的MSN,目前就用它。
个人觉得google的技术还是很牛的,能把Linux和MySQL优化到如此程度,很不简单。
可以说是先驱了。
继续看大家对于数据库和算法的探讨。
个人觉得,要是能提升哪怕是1%的性能,也值得,因为应用会无穷扩大。

论坛徽章:
0
189 [报告]
发表于 2008-06-26 17:31 |只看该作者
原帖由 carny 于 2008-6-26 17:21 发表




那只是用id 算出hash value, 跟據hash value , 去算出在那一台node上,的那筆record, 談不上transaction
請問你一旦某一筆 id field 會時常rename , delete , update ??

这个我也不知道google的要求是多少,这种就向奥运门票系统,一定要知道需求的大小,不同数量级,根本不同。

论坛徽章:
0
190 [报告]
发表于 2008-06-26 17:35 |只看该作者
原帖由 lose 于 2008-6-26 14:59 发表

id怎么不会時時做交易,前面的假设不就是同时有成千上万(同一时刻10000个请求)的人在检查10亿个已有用户名里是否存在,然后创建一万个新的用户名。




那只是用id 算出hash value, 跟據hash value , 去算出在那一台node上,的那筆record, 談不上transaction
請問你一旦某一筆 id field 會時常rename , delete , update ??
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP