免费注册 查看新帖 |

Chinaunix

广告
  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 60293 | 回复: 258
打印 上一主题 下一主题

[Hadoop&HBase] 【讨论】海量数据分析之Hadoop(获奖名单已公布-2012-5-28) [复制链接]

论坛徽章:
0
跳转到指定楼层
[收藏(0)] [报告]
发表于 2012-05-10 09:54 |只看该作者 |正序浏览

获奖名单已公布,详情请看:http://bbs.chinaunix.net/thread-3748443-1-1.html   

一般情况下数据日志是每天从生产数据库导出到数据服务器,再通过一个脚本分析这些日志并存入数据库中,这种方式在数据量不大的情况下还是不错的方式。但如果数据量增大,所需的时间就是几何的增长。为了减少每天log分析的时间以及数据的稳定性,我们需要搭建一个稳定的高效处理的平台来,使用并行的方式处理这些log。

本次讨论话题:

1,Hadoop所应用的环境
2,Hadoop所在平台级优化
3,Hadoop配置参数优化
4,Hadoop代码级优化
5,Hadoop的MR其它语言编写(Python等)

活动要求:针对以上任意话题进行分享和讨论。

邀请嘉宾:

crazyhadoop  linux环境编程斑竹,Linux 爱好者。

newfishwa     《高可用性的HDFS—Hadoop分布式文件系统深度实践》作者

活动有奖:我们为大家准备《高可用性的HDFS—Hadoop分布式文件系统深度实践》一书7本,奖励给积极参与讨论的网友。欢迎大家积极分享,讨论!



论坛徽章:
0
258 [报告]
发表于 2014-01-27 14:42 |只看该作者
hadoop 的思想是将一个大的任务分割成较小的任务,然后将分割后的任务到不同的机器上并行执行....

论坛徽章:
0
257 [报告]
发表于 2012-08-24 15:25 |只看该作者
回复 259# liuxuejin


    可能认为只是hdfs吧

论坛徽章:
0
256 [报告]
发表于 2012-08-24 12:56 |只看该作者
我吐了!hadoop 居然是适合做 文件下载 视频点播。笑抽了 。干净扫盲吧。

论坛徽章:
0
255 [报告]
发表于 2012-08-13 22:11 |只看该作者
学西了,大家分享下

论坛徽章:
0
254 [报告]
发表于 2012-08-13 02:32 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
253 [报告]
发表于 2012-08-12 20:19 |只看该作者
回复 258# emuen_1982


    谢谢
一起努力

论坛徽章:
4
CU十二周年纪念徽章
日期:2013-10-24 15:41:34摩羯座
日期:2013-12-24 13:05:332015亚冠之西悉尼流浪者
日期:2015-10-09 16:03:47fulanqi
日期:2016-06-17 17:54:25
252 [报告]
发表于 2012-08-10 16:14 |只看该作者
回复 255# owenhappy


用户行为分析,看你的应用程序架构,如果有比较详细的LOG记录,分析这个LOG即可~


   

论坛徽章:
0
251 [报告]
发表于 2012-08-10 15:05 |只看该作者
有点兴趣,关注ing

论坛徽章:
0
250 [报告]
发表于 2012-08-03 17:32 |只看该作者
回复 256# hbsycw


知道的几个类型如:电力,电信,银行, 感觉DM , 用hadoop不适合, 这些业务数据更多的是record类型,而且基本分析和查询都有很多的索引,并且每个记录都很小。

挖据的时候应该是随着业务变化而变化的,不是一成不变的, 不可能存了一堆数据,然后挖完一个场景就对别的应用场景无效了?》 那多浪费。

或者来个实际点的。 我们来分析个业务:分析上网爱好。 采集电信宽带的上网URL。 然后对上网用户进行偏好分析和地区分析,你觉得这个数据怎么存?

这个数据存一年应该够海量吧。

论坛徽章:
4
CU十二周年纪念徽章
日期:2013-10-24 15:41:34摩羯座
日期:2013-12-24 13:05:332015亚冠之西悉尼流浪者
日期:2015-10-09 16:03:47fulanqi
日期:2016-06-17 17:54:25
249 [报告]
发表于 2012-08-03 16:09 |只看该作者
本帖最后由 hbsycw 于 2012-08-03 16:14 编辑

回复 255# owenhappy

ETL是DW的前提和基础,而DM这一块是构筑的DW的基础之上的,这里谈的是DM适不适合用Hadoop?因此,就没必要扯其它的~

关于系统架构是用PC Server 还是小机,这个有另一个帖子讨论,这里就不和你辩驳了。

http://bbs.chinaunix.net/thread-3750910-1-1.html


   
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP