ChinaUnix.net
相关文章推荐:

hadoop权威指南

本帖最后由 ulovko 于 2012-07-27 05:45 编辑 OReilly_hadoop_The-Definitive-Guide-3rd-Edition201205.pdf:

by ulovko - NoSQL技术 - 2012-09-08 12:50:54 阅读(1369) 回复(4)

相关讨论

hadoop权威指南(第2版) [td=1,1,80]作  者[td=2,1]Tom wbite [td=1,1,80]出 版 社[td=2,1]清华大学出版社 [td=1,1,80]图书定价[td=2,1]¥89.00 图书简介: 《hadoop权威指南(第2版)》从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;hadoop分布式文件系统;hadoop的i/o、mapreduce应用程序开发;...

by 风铃之音 - NoSQL技术 - 2011-07-29 21:40:27 阅读(9726) 回复(41)

拍卖规则:您出的价格,必须是您chinaunix帐户积分以内的价格,出价成功以后,系统立即扣除相应CU积分,并且显示您的竞价记录。竞拍期间您出价的CU积分将被冻结,在拍卖结束后系统将自动把竞拍出局会员的CU积分统一归还。 胜出者出价时间以拍卖帖规定的结束时间为准(例如结束时间为15:00:00),在此时间内出价成功的为有效出价,将宣布胜出。如若胜出者出价时间超过拍卖帖规定的结束时间(例如出价时间为15:00:01),届时论坛管理...

云计算拍卖图书会员拍卖程序

by 风铃之音 - NoSQL技术 - 2012-10-20 21:33:16 阅读(4299) 回复(25)
by 屁股发痒 - NoSQL技术 - 2011-12-05 09:25:11 阅读(1556) 回复(4)

有木有做运维的同事维护hadoop+hbase的啊 ?想取取经!

by split_two - Hadoop和大数据技术 - 2012-06-05 09:05:46 阅读(1854) 回复(9)

参考
http://hadoop.apache.org/common/docs/current/streaming.html
http://dongxicheng.org/mapreduce/hadoop-streaming-programming/
1、
hadoop Streamimg是随hadoop发布的一个编程工具,允许使用任何可执行文件或脚本创建和运行map/reduce job。
例如:最简单的
$hadoop_HOME/bin/hadoop  jar $hadoop_HOME/hadoop-streaming.jar \
  ...

by xjc2694 - NoSQL技术 - 2011-12-23 02:32:19 阅读(1321) 回复(0)

一篇介绍hadoop lzo的文档:
hadoop-at-twitter-part-1-splittable-lzo-compression/" target="_blank" target="_blank">http://www.cloudera.com/blog/2009/11/hadoop-at-twitter-part-1-splittable-lzo-compression/

1、在所有node安装lzo的动态链接库文件。
下载:http://www.oberhumer.com/opensource/lzo/
h...

by xjc2694 - NoSQL技术 - 2011-12-23 02:32:19 阅读(1801) 回复(0)

原文地址:http://blog.csdn.net/calvinxiu/archive/2007/02/09/1506112.aspx hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要...

Hadoopjava分布式

by surpass_li - NoSQL技术 - 2011-01-28 15:02:44 阅读(10317) 回复(5)

hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发处理或者分布式系统的经验,就可以处理超大的分布式系统得资源。...

by xpjjy - Java文档中心 - 2009-01-09 16:47:36 阅读(1148) 回复(0)

1.解压 [color="#555555"]1 tar -zvxf hadoop-0.16.1.tar.gz 同时设置环境变量 [color="#555555"]1 2 3 4 5 6 7 8 9 10 11 12 13 14 # vi /etc/profile JAVA_HOME=/usr/local/jrockit export JAVA_HOME PATH=$PATH:$JAVA_HOME/bin export PATH CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib export CLASSPATH hadoop_HOME=/usr/local/hadoop export hadoop_HOME hadoop_LOG_DIR=/var/log/hadoop export hadoop_LOG_DIR hadoop_...

by 剑心通明 - BSD文档中心 - 2008-03-23 20:47:00 阅读(1630) 回复(0)

hadoop通常被认定是能够帮助你解决所有问题的唯一方案。 当人们提到“大数据”或是“数据分析”等相关问题的时候,会听到脱口而出的回答:hadoop!实际上hadoop被设计和建造出来,是用来解决一系列特定问题的。对某些问题来说,hadoop至多算是一个不好的选择。对另一些问题来说,选择hadoop甚至会是一个错误。对于数据转换的操作,或者更广泛意义上的抽取-转换-装载的操作(译者注:Extraction Transformation Load,ETL,数据仓...

by send_linux - 数据仓库与数据挖掘 - 2013-11-25 20:06:50 阅读(17872) 回复(4)