ChinaUnix.net
相关文章推荐:

hadoop103 ubuntu

安装环境: 1.ubuntu9.10 2.hadoop-0.20.1,Pseudo-Distributed Operation,目前是在自己的Notebook上安装,所以先选择这个模式,下学期在实验室环境下安装Fully-Distributed Operation 安装JAVA环境: 1.安装Java环境: Open a shell prompt (terminal) and type the following to install JDK and JRE: $ sudo apt-get install sun-java6-bin sun-java6-jre sun-java6-jdk 2.更新 updates all alternatives be...

by jiangwen127 - NoSQL技术 - 2010-01-21 20:55:59 阅读(2573) 回复(0)

相关讨论

   MapR与ubuntu Linux开发商Canonical合作,实现ubuntuhadoop大数据平台无缝兼容。 据介绍,ubuntu/MapR包括MapR M3版本的hadoop,以支持ubuntu 12.04 LTS和12.10版本。该软件目前可以通过Canonical的ubuntu合作伙伴获得,时间从4月25日开始。 Canonical公司副总裁Kyle MacDonald表示,MapR M3是一款易于部署的企业级hadoop解决方案,“我们为ubuntu客户提供了高效执行大数据的新途径”。 MapR M3是一款捆绑有HBase数据库...

by Send_linux - IT资讯 - 2013-04-06 09:46:37 阅读(1192) 回复(0)

有个错:

将ssh-keygen -rsa -P ""改成ssh-keygen rsa -P ""
然后java的路径默认应该是 /usr/lib/jvm/java-6-openjdk
如果你的ssh提示需要密码,还需要用cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys来取消密钥

by xuyuanchao_cnu - NoSQL技术 - 2011-12-23 02:32:19 阅读(1023) 回复(0)

1.环境准备
jdk-6u20-linux-i586.bin(据称jdk在6u20之后的版本,有包名修改,与eclipse3.6集成安装会出现不兼容,所以在此采用jdk6u20版本)
hadoop-0.21.0.tar.gz
ubuntu10.10

2. 安装 jdk-6u20-linux-i586.bin

复制jdk-6u20-linux-i586.bin 安装文件到/usr目录下

by phoenixrising - NoSQL技术 - 2011-12-19 13:54:03 阅读(1482) 回复(0)

有木有做运维的同事维护hadoop+hbase的啊 ?想取取经!

by split_two - Hadoop和大数据技术 - 2012-06-05 09:05:46 阅读(1858) 回复(9)

参考
http://hadoop.apache.org/common/docs/current/streaming.html
http://dongxicheng.org/mapreduce/hadoop-streaming-programming/
1、
hadoop Streamimg是随hadoop发布的一个编程工具,允许使用任何可执行文件或脚本创建和运行map/reduce job。
例如:最简单的
$hadoop_HOME/bin/hadoop  jar $hadoop_HOME/hadoop-streaming.jar \
  ...

by xjc2694 - NoSQL技术 - 2011-12-23 02:32:19 阅读(1324) 回复(0)

一篇介绍hadoop lzo的文档:

1、在所有node安装lzo的动态链接库文件。
下载:http://www.oberhumer.com/opensource/lzo/
h...

by xjc2694 - NoSQL技术 - 2011-12-23 02:32:19 阅读(1805) 回复(0)

原文地址:http://blog.csdn.net/calvinxiu/archive/2007/02/09/1506112.aspx hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要...

Hadoopjava分布式

by surpass_li - NoSQL技术 - 2011-01-28 15:02:44 阅读(10320) 回复(5)

hadoop 是Google MapReduce 的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样, MapReduce的run-time系统会解决输入数据的分布细节,跨越机器集群的程序执行调度,处理机器的失效,并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发处理或者分布式系统的经验,就可以处理超大的分布式系统得资源。...

by xpjjy - Java文档中心 - 2009-01-09 16:47:36 阅读(1151) 回复(0)

1.解压 [color="#555555"]1 tar -zvxf hadoop-0.16.1.tar.gz 同时设置环境变量 [color="#555555"]1 2 3 4 5 6 7 8 9 10 11 12 13 14 # vi /etc/profile JAVA_HOME=/usr/local/jrockit export JAVA_HOME PATH=$PATH:$JAVA_HOME/bin export PATH CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib export CLASSPATH hadoop_HOME=/usr/local/hadoop export hadoop_HOME hadoop_LOG_DIR=/var/log/hadoop export hadoop_LOG_DIR hadoop_...

by 剑心通明 - BSD文档中心 - 2008-03-23 20:47:00 阅读(1632) 回复(0)

hadoop通常被认定是能够帮助你解决所有问题的唯一方案。 当人们提到“大数据”或是“数据分析”等相关问题的时候,会听到脱口而出的回答:hadoop!实际上hadoop被设计和建造出来,是用来解决一系列特定问题的。对某些问题来说,hadoop至多算是一个不好的选择。对另一些问题来说,选择hadoop甚至会是一个错误。对于数据转换的操作,或者更广泛意义上的抽取-转换-装载的操作(译者注:Extraction Transformation Load,ETL,数据仓...

by send_linux - 数据仓库与数据挖掘 - 2013-11-25 20:06:50 阅读(17934) 回复(4)