免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: Gray1982
打印 上一主题 下一主题

[Hadoop&HBase] 【讨论】海量数据分析之Hadoop(获奖名单已公布-2012-5-28) [复制链接]

论坛徽章:
0
181 [报告]
发表于 2012-05-21 12:54 |只看该作者
回复 184# Gray1982


    自己写MR 似乎这个作为开发者是必须的

   cu上的很多还都是 运维角色 自己写MR 不是太靠谱 呵呵

   当然 学习些MR 应该也不是太复杂吧

论坛徽章:
0
182 [报告]
发表于 2012-05-21 13:54 |只看该作者
回复 185# kns1024wh


    嗯,不过现在很多运维在一些方面和开发区别不大了
Hadoop查询一般用Pig来写,不过因为不是很简洁,个人一直用Python写写东西

论坛徽章:
0
183 [报告]
发表于 2012-05-21 16:52 |只看该作者
回复 186# Gray1982


    是呀 要求也是必须会code

论坛徽章:
2
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:11
184 [报告]
发表于 2012-05-21 20:36 |只看该作者
回复 2# Gray1982


    不明白为什么要改网卡缓存

论坛徽章:
0
185 [报告]
发表于 2012-05-22 00:13 |只看该作者
回复 188# dreamxe


   应该说是加大网卡传输速度,这样明白了吧

论坛徽章:
0
186 [报告]
发表于 2012-05-22 12:35 |只看该作者
回复 189# Gray1982

优化 挖掘 主机的最大性能


   

论坛徽章:
0
187 [报告]
发表于 2012-05-22 13:07 |只看该作者
900节点的数据排序9TB大约需要1.8小时
使用这些非默认配置值:

dfs.block.size = 134217728
dfs.namenode.handler.count = 40
mapred.reduce.parallel.copies = 20
mapred.child.java.opts =-Xmx512m
fs.inmemory.size.mb = 200
io.sort.factor = 100
io.sort.mb = 200
io.file.buffer.size = 131072
1400节点群集上的数据排序14TB需要2.2小时
排序在2000节点的集群20TB需要2.5小时。
配置是:

mapred.job.tracker.handler.count = 60
mapred.reduce.parallel.copies = 50
tasktracker.http.threads = 50
mapred.child.java.opts =-Xmx1024m

论坛徽章:
0
188 [报告]
发表于 2012-05-22 23:35 |只看该作者
迟早会接触到这技术滴,顶

论坛徽章:
0
189 [报告]
发表于 2012-05-23 10:45 |只看该作者
欢迎大家分享学习中的经验:wink:

论坛徽章:
9
技术图书徽章
日期:2014-10-14 15:48:13数据库技术版块每日发帖之星
日期:2015-06-04 22:20:00数据库技术版块每日发帖之星
日期:2015-06-10 22:20:00数据库技术版块每日发帖之星
日期:2015-06-11 22:20:00数据库技术版块每日发帖之星
日期:2015-06-13 22:20:00IT运维版块每日发帖之星
日期:2015-09-22 06:20:00IT运维版块每日发帖之星
日期:2015-12-08 06:20:00综合交流区版块每日发帖之星
日期:2016-02-02 06:20:00IT运维版块每日发帖之星
日期:2016-07-25 06:20:00
190 [报告]
发表于 2012-05-23 13:40 |只看该作者
Gray1982 发表于 2012-05-22 13:07
900节点的数据排序9TB大约需要1.8小时
使用这些非默认配置值:


2000个节点,可以承载一个地级市的宽带业务,拿来做排序实验实在是有点亏了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP