1 234 5 6 7 8 9 10 ... 26 / 26 页下一页

[Hadoop&HBase] 【讨论】海量数据分析之Hadoop（获奖名单已公布-2012-5-28） [复制链接]

fu20

白手起家

论坛徽章:: 0

21楼 [报告]

发表于 2012-05-10 21:51 |只看该作者

回不回呢，考虑再三，还是不回了吧。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

bbjmmj

巨富豪门

论坛徽章:: 9

22楼 [报告]

发表于 2012-05-10 23:25 |只看该作者

HDFS局限性很大，只能支持流式写入，不支持随机的文件写入，随机读的性能也很差，小文件性能也不好，除非你的应用是顺序访问文件，并且以大文件为主，否则不用考虑HADOOP。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Gray1982

版主

论坛徽章:: 0

23楼 [报告]

发表于 2012-05-11 10:31 |只看该作者

回复 24# bbjmmj

小文件放在贴在中，调块大小
Hadoop一般用来分析日志，这样的日志文件会有小的吗

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hbsycw

丰衣足食

论坛徽章:: 4

24楼 [报告]

发表于 2012-05-11 10:39 |只看该作者

bbjmmj 发表于 2012-05-10 23:25
HDFS局限性很大，只能支持流式写入，不支持随机的文件写入，随机读的性能也很差，小文件性能也不好，除非你 ...

HADOOP本质上是个批处理系统，是不适合实时应用的，当然对随机读写的需求就不高了~

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cu_little_bird

小富即安

论坛徽章:: 3

25楼 [报告]

发表于 2012-05-11 11:05 |只看该作者

只听说过分布式文件系统，还不知道HADOOP是什么，呵呵

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cu_little_bird

小富即安

论坛徽章:: 3

26楼 [报告]

发表于 2012-05-11 11:11 |只看该作者

HADOOP 有没有软硬件的要求呢？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

rootsecurity

稍有积蓄

论坛徽章:: 0

27楼 [报告]

发表于 2012-05-11 11:37 |只看该作者

一直没机会尝试HADOOP，据说某数字公司的软件下载服务器就是用的HDFS分布式。具体为fuse+hadoop。
什么datanode、namenode一大推，有点云里雾里。真是云。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

newfishwa

白手起家

论坛徽章:: 0

28楼 [报告]

发表于 2012-05-11 12:21 |只看该作者

回复 29# rootsecurity

其实，对于用户来说，使用分布式文件系统和本地磁盘文件系统，是没有什么区别的，它们只是实现不同而已。

在HDFS中，有两类重要的节点：NameNode和DataNode

其中，NameNode负责管理整个文件系统，它存储着整个文件的系统信息，我们称这部分信息为元数据，例如：文件系统有多少个文件、每个文件的名字、文件的大小、所有者、权限、以及每个文件的分块信息等等。

  而DataNode则负责存储真实数据，也就是说，用户写入一个文件，文件的内容存储在DataNode上的。

  在整个系统中，NameNode只有一个，它管理DataNode；DataNode有多个，如果需要增加HDFS的容量，则只需要增加DataNode节点就可以了。

  另外，Fuse模块，是一个在用户空间实现文件系统的函数库。简单的说，通常情况下，应用程序访问HDFS是通过HDFS提供函数库的API访问的，我们不能使用标准的posix接口函数（C、JAVA中所提供的标准I/O函数）来访问HDFS。通过使用FUSE模块，就可以把HDFS虚拟成一块磁盘，直接挂载到某个目录下，这样应用程序就可以直接使用标准接口来访问了，和访问本地磁盘一样。