免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: 无风之谷
打印 上一主题 下一主题

[Hadoop&HBase] 有奖图书试读《Hadoop实战》 欢迎强力参与! [复制链接]

论坛徽章:
0
11 [报告]
发表于 2011-11-24 09:15 |只看该作者
回复 12# crazyhadoop


    看你的ID就明白了 哈哈

论坛徽章:
1
天蝎座
日期:2013-12-06 18:23:58
12 [报告]
发表于 2011-11-24 09:33 |只看该作者
回复 13# 无风之谷


    哈哈~~ Hadoop的路还有很长啊

论坛徽章:
0
13 [报告]
发表于 2011-11-24 22:16 |只看该作者
本帖最后由 yahoon 于 2011-12-04 11:46 编辑

试读了一下,蛮好的一本书,谈谈我的感受先
活动话题:
1,在工作中是否应用了hadoop?

由于公司现在并没有类似的业务需求,所以暂时还没用,但个人很关注hadoop的发展
              2,你认为hadoop的优势有哪些?

首先肯定是部署简单,支持的接口多,结构简单,相关的资源和应用案例很多. 不管是国内还是国际, 资料多,从事相关工作的人员也多. 相对来说比较成熟.
尤其还有各家有能力的厂商做了商业化的二次开发,可见对其扩展也是比较简单的.
最大的优势 也就是对海量非结构化数据的存储和管理,计算.
             3,谈谈你阅读完样章的感受

由于是国人的作品,描述各方面比较符合国人习惯.尤其作者的专业性使得技术描述完全没问题.
有很多类似翻译书籍经常是"外行"翻译专业书籍....后果可想而知
作者先讲理论再讲安装应用,然后讲内部的一些具体实现机制和架构,比较符合以浅入深的规律学习习惯.
支持原创

最后说一点个人观点:
个人觉得hadoop是区别于大家习惯的传统DBMS的一种系统.
传统的DBMS,主要是两方面的功能:
1 是存储数据
2 是处理数据(例如更新,查询,计算等)
但是它有一个很大的弱点就是:
1 对数据大小敏感,通常来数据量小操作快,数据量巨大,性能下降明显(因为通常是单机集中存储),且只能优化或分区,无线性扩展能力
2 对数据格式有严格要求,通常我们用的Rdbms(即关系型数据库)规定数据必须为行与列的集合,只要满足这样苛刻条件的数据才能进行存储和处理

hadoop同样解决的是这两方面的问题,也就是最核心的两个组件:
1 hdfs是解决了存储数据的问题,针对大数据,非结构化数据是亮点
2 map/reduce解决了用户大数据的并行处理

当然与DBMS相比也是有劣势的:
hadoop主要用于大数据集的离线处理
不支持DBMS的OLTP的特性
不支持大家习惯的SQL等

从目前来看,hadoop的着重点并不是分布式存储(共享存储的下一代),而是通过分布式存储来实现分布式计算(即以计算移动而不是数据移动)
这明显有别于其他一些分布式存储如fastDFS,mogileFS,mooseFS以提供高吞吐量的文件读写为指标.更准确的说这些产品是NFS的升级版

hadoop不是万能的,任何的技术本身没有优劣之分,作为一家务实的公司,更不能为了用某个"先进"技术而强推. 并不是为了用而用, 更多的是要考虑本身的业务场景和需求,合理选择适合自己的产品,甚至某些情况下选择商业产品,没有最好,只有目前最适合

论坛徽章:
0
14 [报告]
发表于 2011-11-25 14:25 |只看该作者
前段时间,由于工作上的需要,学习了一下hadoop,感觉就是,很好很强大!
下面说一下我的感受:
在现如今的信息社会,数据成为我们生活的基础,数据存储和处理就是我们必须要解决的问题!
在以前的数据量相对小的阶段(GB级别),ORACLE,SQLSERVER等大行其道,所谓关系数据库的存储与数据挖掘,搞得很神秘。而现在的数据以TB做单位来计算的时候,原来那些关系数据库就捉襟见肘了。
而hadoop的出现让关系数据库都变成了浮云!!!
hadoop的两大核心HDFS和MapReduce分别对应着数据存储和数据处理,完美的解决了用户对海量数据的处理需求!
当然我在使用的时候没有那么多的数据进行测试,但在对几千万条数据(大约20GB)的存储和处理上,sqlserver完败于hadoop+hive。

小型企业肯定还是要用关系数据库,因为数据量小的时候hadoop是体现不出优势来的,但是对于像baidu,新浪微博这样的大型门户网站来说,用户访问数据的处理是一定要用到分布式计算的!

论坛徽章:
0
15 [报告]
发表于 2011-11-27 21:42 |只看该作者
前段时间,由于工作上的需要,学习了一下hadoop,感觉就是,很好很强大!
下面说一下我的感受:
在现如今 ...
qingchen2012 发表于 2011-11-25 14:25


关系数据库不是中小公司用.

hadoop&NOSQL 与 RDBMS的应用场景不同
最起码ACID的特性是NOSQL无法保证的,这也就限制了某些场合(例如金融商务交易等)必须仍然采用RDBMS

刚去bigdata大会,基本的共识是不要跟风,要看需求和场合,关系数据库和nosql是要结合起来的,而不是谁好谁不好,用谁不用谁的问题

论坛徽章:
59
2015七夕节徽章
日期:2015-08-24 11:17:25ChinaUnix专家徽章
日期:2015-07-20 09:19:30每周论坛发贴之星
日期:2015-07-20 09:19:42ChinaUnix元老
日期:2015-07-20 11:04:38荣誉版主
日期:2015-07-20 11:05:19巳蛇
日期:2015-07-20 11:05:26CU十二周年纪念徽章
日期:2015-07-20 11:05:27IT运维版块每日发帖之星
日期:2015-07-20 11:05:34操作系统版块每日发帖之星
日期:2015-07-20 11:05:36程序设计版块每日发帖之星
日期:2015-07-20 11:05:40数据库技术版块每日发帖之星
日期:2015-07-20 11:05:432015年辞旧岁徽章
日期:2015-07-20 11:05:44
16 [报告]
发表于 2011-11-28 12:57 |只看该作者
MARK一下。

论坛徽章:
0
17 [报告]
发表于 2011-11-29 15:04 |只看该作者
1、在工作中是否应用了hadoop?

目前的实际工作中还没有涉及到hadoop,随着业务的不断发展,就会涌现出海量、复杂的数据,如何全面、精确的分析这些数据,让企业为用户提供更便捷的服务,使用hadoop可以更好的分析和研究这些复杂数据

2、你认为hadoop的优势有哪些?

扩容能力强:能可靠地存储和处理海量数据
成本低:可以通过普通机器组成的服务器群来分发以及处理数据
高效率:通过分发数据,hadoop可以在数据所在的节点上并行地处理它们,这使得处理非常的快速
可靠性强:hadoop能自动地维护数据的多份复制,并且在任务失败后能自动地重新部署计算任务

3、谈谈你阅读完样章的感受

看完书的样章,此书可以全方位的了解hadoop,从初始到安装配置、计算模型、相关子项目,再到实际的生产案例,实战性比较强

论坛徽章:
0
18 [报告]
发表于 2011-11-29 15:18 |只看该作者
回复 19# yahoon


    了解,就是说技术还是要跟着需求和实际情况来走,而不能一味的盲目去追求新技术。

论坛徽章:
0
19 [报告]
发表于 2011-11-29 15:26 |只看该作者
占位 这个是很好的

来补充下
1,在工作中是否应用了hadoop?2,你认为hadoop的优势有哪些?3,谈谈你阅 ...
kns1024wh 发表于 2011-11-22 14:31



    除了核心设计思想MapReduce和HDFS(Hadoop Distributed File System)外,Hadoop还包括了从类SQL查询语言HQL,到NoSQL HBase数据库,以及机器学习库Mahout等内容

论坛徽章:
0
20 [报告]
发表于 2011-11-29 18:57 |只看该作者
除了核心设计思想MapReduce和HDFS(Hadoop Distributed File System)外,Hadoop还包括了从类SQL ...
king_819 发表于 2011-11-29 15:26



    这种才是架构的革新
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP