免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: Gray1982

[Hadoop&HBase] 【讨论】海量数据分析之Hadoop(获奖名单已公布-2012-5-28) [复制链接]

论坛徽章:
0
发表于 2012-08-03 17:32 |显示全部楼层
回复 256# hbsycw


知道的几个类型如:电力,电信,银行, 感觉DM , 用hadoop不适合, 这些业务数据更多的是record类型,而且基本分析和查询都有很多的索引,并且每个记录都很小。

挖据的时候应该是随着业务变化而变化的,不是一成不变的, 不可能存了一堆数据,然后挖完一个场景就对别的应用场景无效了?》 那多浪费。

或者来个实际点的。 我们来分析个业务:分析上网爱好。 采集电信宽带的上网URL。 然后对上网用户进行偏好分析和地区分析,你觉得这个数据怎么存?

这个数据存一年应该够海量吧。

论坛徽章:
0
发表于 2012-08-10 15:05 |显示全部楼层
有点兴趣,关注ing

论坛徽章:
4
CU十二周年纪念徽章
日期:2013-10-24 15:41:34摩羯座
日期:2013-12-24 13:05:332015亚冠之西悉尼流浪者
日期:2015-10-09 16:03:47fulanqi
日期:2016-06-17 17:54:25
发表于 2012-08-10 16:14 |显示全部楼层
回复 255# owenhappy


用户行为分析,看你的应用程序架构,如果有比较详细的LOG记录,分析这个LOG即可~


   

论坛徽章:
0
发表于 2012-08-12 20:19 |显示全部楼层
回复 258# emuen_1982


    谢谢
一起努力

论坛徽章:
0
发表于 2012-08-13 02:32 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
发表于 2012-08-13 22:11 |显示全部楼层
学西了,大家分享下

论坛徽章:
0
发表于 2012-08-24 12:56 |显示全部楼层
我吐了!hadoop 居然是适合做 文件下载 视频点播。笑抽了 。干净扫盲吧。

论坛徽章:
0
发表于 2012-08-24 15:25 |显示全部楼层
回复 259# liuxuejin


    可能认为只是hdfs吧

论坛徽章:
0
发表于 2014-01-27 14:42 |显示全部楼层
hadoop 的思想是将一个大的任务分割成较小的任务,然后将分割后的任务到不同的机器上并行执行....
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP