免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 11887 | 回复: 35
打印 上一主题 下一主题

[Hadoop&HBase] 有奖图书试读《Hadoop实战》 欢迎强力参与! [复制链接]

论坛徽章:
0
1 [报告]
发表于 2011-11-22 14:31 |只看该作者
本帖最后由 kns1024wh 于 2011-11-23 10:03 编辑

占位 这个是很好的

来补充下
1,在工作中是否应用了hadoop?
  1. 目前是互联网群集应用,基于传统的web内容cache 调度 数据库cache 数据库读写等负载技术,用户访问量远远没有google那么大,对于hadoop这个google架构的开源项目还没有用的到。关注如何从传统的负载技术架构转换到hadoop等类似的架构技术。
复制代码
2,你认为hadoop的优势有哪些?
  1. 大量的数据处理的优势,目前还没有到TB的数据,如果是到了TB的数据这个hadoop的海量数据优势将会非常明显。
  2. 海量数据分析,有2G的数据进行下ls也是很漫长的,不要说TB的数据。而Hadoop是一种分布式开发接口,可以基于hadoop开发处理结构或非结构数据的应用。
  3. Hadoop的优势在于它能储存与管理更多的结构化与非结构化的数据。
复制代码
3,谈谈你阅读完样章的感受
  1. 通过Hadoop应用案例分析,Hadoop的安装与配置,Hadoop简介的阅读,可以在一个新的高度来审视web应用群集系统的架构,并对Hadoop有了较新的理解。
  2. 如果能阅读本书对做群集运维的工作的视野将会有很大的扩展。
复制代码

论坛徽章:
0
2 [报告]
发表于 2011-11-22 14:32 |只看该作者
回复 1# 无风之谷


    图书链接呢? 没有看到图书链接呀 PLMM

论坛徽章:
0
3 [报告]
发表于 2011-11-22 14:41 |只看该作者
回复 3# kns1024wh


    已经更新

论坛徽章:
0
4 [报告]
发表于 2011-11-22 14:47 |只看该作者
回复 4# 无风之谷


    这个是必看的储备知识

论坛徽章:
0
5 [报告]
发表于 2011-11-22 15:08 |只看该作者
不错

论坛徽章:
381
CU十二周年纪念徽章
日期:2014-01-04 22:46:58CU大牛徽章
日期:2013-03-13 15:32:35CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55CU大牛徽章
日期:2013-04-17 11:17:19CU大牛徽章
日期:2013-04-17 11:17:32CU大牛徽章
日期:2013-04-17 11:17:37CU大牛徽章
日期:2013-04-17 11:17:42CU大牛徽章
日期:2013-04-17 11:17:47CU大牛徽章
日期:2013-04-17 11:17:52CU大牛徽章
日期:2013-04-17 11:17:56
6 [报告]
发表于 2011-11-22 15:19 |只看该作者
占位 这个应该好好看看

论坛徽章:
1
狮子座
日期:2013-12-05 16:04:37
7 [报告]
发表于 2011-11-22 18:05 |只看该作者
1,在工作中是否应用了hadoop?


目前工作中尚未涉及到hadoop。但是最近我自己靠着hadoop中文网站自己模拟了一下,但是很多不理解。

2,你认为hadoop的优势有哪些?


理解不太深刻,所以,优势还不知道。只知道对于大数据量的处理比较有优势。

3,谈谈你阅读完样章的感受?



单机和伪分布的区别在哪儿呢?还是不太明白。

论坛徽章:
4
CU大牛徽章
日期:2013-03-13 15:29:07CU大牛徽章
日期:2013-03-13 15:29:49CU大牛徽章
日期:2013-03-13 15:30:192015年迎新春徽章
日期:2015-03-04 09:57:09
8 [报告]
发表于 2011-11-23 09:33 |只看该作者
本帖最后由 dooros 于 2011-11-29 10:59 编辑
1.在工作中是否应用了hadoop?

首先,目前公司没有TB级数据的处理需求,暂时没有考虑大型分布式计算的部署。
其次,现有系统完全能够胜任现有的服务,并且具有相当的稳定性。
最后,目前没有非常熟悉hadoop这块的人才。
所以,公司目前没有试用hadoop,我认为,对待新技术的出现不能盲从,如果现有系统能够胜任现有应用,并且在一段时期内不会对现有系统造成大负载的崩溃,完全可以采取保守的做法,对现有系统的维护往往能够换来更多的经济效益。当然不是说对新技术视而不见,新技术的出现代表了一个时代的科技发展趋势。如果公司以后肯定会出现TB级数据处理的需求,可以进行内部分析、调研,测试hadoop带来的性能提升,为日后的系统部署做准备。

2.你认为hadoop的优势有哪些?

(1)hadoop是开源的,降低了学习和应用的成本。在其后有大量的公司使用了hadoop进行数据处理,同时也在为hadoop的发展做贡献,所以,其可靠性和稳定性,毋庸置疑。
(2)适合大规模数据处理,在互联网爆炸时代,数据量也是呈指数增长,而且大部分是非结构化的数据,hadoop能够带来高效的数据处理方式。
(3)hadoop集群是由普通PC构建的无共享式架构,处理数据时就近读取map,各任务间没有相关依赖,对处理完的数据统一整理后分发,降低了大量数据的传输,提高了效率。
(4)hadoop集群具有良好的容错性。hadoop保存了数据的多个副本,并且会对失败的任务重新分发,所以部分节点的故障对集群的影响不大。
(5)hadoop集群具有高扩展性。hadoop对硬件的要求低,扩展hadoop集群只需增加普通PC节点即可提高集群的数据处理能力。
(6)用户不需要关心hadoop是如何执行数据处理的,只需要专注MapReduce的模型描述,这样方便了用户的开发和使用。
(7)HDFS能够检测和快速恢复硬件故障,另外它的备份恢复机制保证了hadoop的高可靠性。

3.谈谈你阅读完样章的感受

从给出的前两章来看,这本书还是十分适合入门的。开篇就给出了hadoop的详细介绍,使得不了解hadoop的读者,可以快速的对hadoop有个大致的了解,有个概念。
此书的题目《Hadoop实战》,所以作者在详细的介绍后,就给出了hadoop的安装方法,让读者可以在实际操作中学习、掌握其中的奥秘。不过,作者只给出了ubuntu安装的例子,这对于长期使用linux的用户完全没有影响,但是对于初接触linux运维的用户来说可能就有些影响。包管理器的不同,软件仓库也不通,ubuntu的软件仓库里的软件数量比centos的多(没有安装第三方源)。我认为jdk之类的安装还是自己到oracle下载安装比较实际。
第三章,案例分析,我认为非常不错。虽然只是简要的介绍,但是让读者看到了“希望”,就是我们学这个东西是为了什么,在什么场景下能应用到,而不是盲目的学习。
总体来说感觉非常不错,期望阅读到完整的书籍,谢谢。

论坛徽章:
0
9 [报告]
发表于 2011-11-23 12:25 |只看该作者
记得前一段时间Cu有个nosql的活动,hadoop就是其中一种.

数据超过一定的数量,传统的基于关系型Sql的传统数 ...
chenyx 发表于 2011-11-22 15:47



    已经不是sql 是nsql

论坛徽章:
1
天蝎座
日期:2013-12-06 18:23:58
10 [报告]
发表于 2011-11-23 12:54 |只看该作者
大数据的时代到来了,我想hadoop提供的是一种初级的解决方法,只是可以用了,但远远没有达到大数据的处理要求。对于任何企业来说,数据都是其商业皇冠上最为耀眼夺目的那颗宝石。伴随着传统的商业智能系统向纵深应用的拓展,商业决策已经越来越依赖于数据。然而,传统的商业智能系统中用以分析的数据,大都是企业自身信息系统中产生的运营数据,这些数据大都是标准化、结构化的。已经不能符合当今数据处理的需求。现在数据处理正在向智能化,随机化方向发展。

Hadoop恰好提供了这么一个解决方案,这个架构还需要进一步的填充

团购网站,搜索网站,社交网站,淘宝产生了大量的用户行为,对这些行为的研究和处理,促使了hadoop等大型数据处理架构的诞生, 现在百度已经实现了,用户在其页面的所有鼠标轨迹的记录。想想这是多么大的一批数据。对这些数据的研究,相信可以更加深入的了解分析用户的行为和意图。

看过那本Hadoop权威指南,对hadoop算是有了初步的认识。很可惜没有C实现的版本。我想以后hadoop会被深度改造的。还很有可能成为历史。哈哈
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP