hadoop 二次排序

基于hadoop大规模数据排序算法---韩旭红组第二次报告

基于hadoop的大规模数据排序算法

by xuyuanchao_cnu - NoSQL技术 - 2011-12-23 02:39:08 阅读（1239）回复（0）

其他文章推荐

LINUX 负载均衡及双机热备份设置(heartbeat+lvs)---测试通过

java如何操作word,excel文档

结构体初始化

dell6650和DELL的EMC cX300盘柜一台

Flexible Packet Filtering (5)

斑竹和各位高人，有熟悉 ISA 2006 的，请教一个问题

mc环境vgexport /vgimport 出错

chinaunix改名

shell基础_01

QQ空间新浪微博腾讯微博人人网开心网豆瓣网百度空间更多

相关讨论

基于hadoop大规模数据排序算法-万虎组-第二次报告

by xuyuanchao_cnu - NoSQL技术 - 2011-12-23 02:39:08 阅读（1173）回复（0）

基于hadoop大规模数据排序算法-万虎组-第零次报告

“基于hadoop大规模数据排序算法”整体规划-万虎组

组长：万虎
成员：万虎、牛庆亚、宋思梦、文滔、胡海绅

前言

关于云计算的基础知识请参考上届师兄师姐在谷...

by xuyuanchao_cnu - NoSQL技术 - 2011-12-23 02:39:08 阅读（911）回复（0）

基于hadoop大规模数据排序算法---韩旭红组第一次报告

by xuyuanchao_cnu - NoSQL技术 - 2011-12-23 02:39:08 阅读（1153）回复（0）

基于hadoop大规模数据排序算法-万虎组-第一次报告

 基于hadoop大规模数据排序算法-万虎组-第...

by xuyuanchao_cnu - NoSQL技术 - 2011-12-23 02:39:08 阅读（1319）回复（0）

基于hadoop 的大规模数据排序-万虎组-第三次

...

by xuyuanchao_cnu - NoSQL技术 - 2011-12-23 02:32:19 阅读（1022）回复（0）

hadoop的1TB排序

1、1TB（或1分钟）排序的冠军作为分布式数据处理的框架，集群的数据处理能力究竟有多快？或许1TB排序可以作为衡量的标准之一。 1TB排序，就是对1TB（1024GB，大约100亿行数据）的数据进行排序。2008年，hadoop赢得1TB排序基准评估第一名，排序1TB数据耗时209秒。后来，1TB排序被1分钟排序所取代，1分钟排序指的是在一分钟内尽可能多的排序。2009年，在一个1406个节点组成的hadoop集群，在59秒里对500GB完成了排序；而在1460个节...

by teddylw1611616 - NoSQL技术 - 2011-02-28 21:24:57 阅读（1791）回复（0）

hadoop学习笔记二安装部署

硬件环境共有3台机器，均使用的FC5系统，Java使用的是jdk1.6.0。IP配置如下： dbrg-1：202.197.18.72 dbrg-2：202.197.18.73 dbrg-3：202.197.18.74 这里有一点需要强调的就是，务必要确保每台机器的主机名和IP地址之间能正确解析。一个很简单的测试办法就是ping一下主机名，比如在dbrg-1上ping dbrg-2，如果能ping通就OK！若不能正确解析，可以修改/etc/hosts文件，如果该台机器作Namenode用，则需要在hosts文件中加上集群中所...

by menyuchun - NoSQL技术 - 2011-09-22 15:07:52 阅读（4653）回复（4）

hadoop学习笔记二安装部署(转)

本文主要是以安装和使用 hadoop-0.12.2 为例，指出在部署hadoop的时候容易遇到的问题以及如何解决。硬件环境共有3台机器，均使用的centos4.4系统，Java使用的是jdk1.5.0。IP配置如下： dbrg-1：202.197.18.72 dbrg-2：202.197.18.73 dbrg-3：202.197.18.74 这里有一点需要强调的就是，务必要确保每台机器的主机名和IP地址之间能正确解析。一个很简单的测试办法就是ping一下主机名，比如在dbrg-1上ping dbrg-2，如果能ping通就OK！...

by dealover - Linux文档专区 - 2007-08-29 15:48:36 阅读（870）回复（0）

hadoop平台上的海量数据排序

Yahoo!研究人员使用hadoop完成了Jim Gray基准排序，此排序包含许多相关的基准，每个基准都有自己的规则。所有的排序基准都是通过测量不同记录的排序时间来制定的，每个记录为100字节，其中前面的10字节是键，剩余的部分是数值。MinuteSort是比较在一分钟内所排序的数据量大小，GraySort是比较在对大规模数据（至少100TB）进行排序时的排序速率（TBs/minute）。基准规则具体如下：

输入数据必须与数据...

by 码工 - NoSQL技术 - 2011-12-23 02:32:19 阅读（1318）回复（0）

基于hadoop的大规模数据排序算法-----韩旭红组



by xuyuanchao_cnu - NoSQL技术 - 2011-12-23 02:32:19 阅读（1081）回复（0）

盛拓传媒：

IT168 | 泡泡网 | 汽车之家 | 二手车之家 | 渠道168 | ITPUB | IXPUB | ChinaUnix | 安卓之家 | 苹果园 | 家商城 | 苹果论坛



盛拓传媒简介 | 关于IT168 | 合作伙伴 | 广告服务 | 使用条款 | 投稿指南 | 诚聘精英 | 联系我们 | ITPUB论坛 | 网站导航 | 往日回顾

北京皓辰网域网络信息技术有限公司. 版权所有京ICP证:060528号北京市公安局海淀分局网监中心备案编号：1101082001
广播电视节目制作经营许可证：编号（京）字第1149号

ITPUB推荐文章解答你所有技术难题