免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234
最近访问板块 发新帖
楼主: heguangwu
打印 上一主题 下一主题

[其他] 由大数据引发的概念潮,关于“大数据”你想聊点啥? [复制链接]

论坛徽章:
19
处女座
日期:2014-07-18 14:50:5415-16赛季CBA联赛之北京
日期:2019-09-16 15:39:1415-16赛季CBA联赛之上海
日期:2019-09-15 15:29:0415-16赛季CBA联赛之山西
日期:2017-03-09 10:58:232017金鸡报晓
日期:2017-02-08 10:33:212017金鸡报晓
日期:2017-01-10 15:13:2915-16赛季CBA联赛之深圳
日期:2016-12-15 17:55:53C
日期:2016-10-25 16:00:1515-16赛季CBA联赛之新疆
日期:2016-07-21 14:02:0415-16赛季CBA联赛之江苏
日期:2016-06-30 12:15:04shanzhi
日期:2016-06-17 17:59:31平安夜徽章
日期:2015-12-26 00:06:30
31 [报告]
发表于 2015-08-29 23:35 |只看该作者
我觉得算法在大数据应用中起着非常重要的作用。
算法是计算机科学领域最重要的基石之一,算法在大数据应用中起着非常重要的作用。
无论是大数据存储、大数据分析,算法都起着决定性的作用。 数据挖掘分析通过算法来更好地理解数据, 在数据上进行基于各种算法的计算,做进一步预测性分析,可以根据可视化分析和数据挖掘的结果做出一些预测性的判断,实现一些高级别数据分析的需求。用于挖掘的算法很复杂,并且计算涉及的数据量和计算量都很大,比较典型算法有用于聚类的K-Means、用于统计学习的SVM和用于分类的Naive Bayes,主要使用的工具有HadoopMahout等。

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
32 [报告]
发表于 2015-08-30 19:11 |只看该作者
,没有算法就无法找到数据的价值,存储、分析只是基础和平台
回复 31# shenlanyouyu


   

论坛徽章:
19
处女座
日期:2014-07-18 14:50:5415-16赛季CBA联赛之北京
日期:2019-09-16 15:39:1415-16赛季CBA联赛之上海
日期:2019-09-15 15:29:0415-16赛季CBA联赛之山西
日期:2017-03-09 10:58:232017金鸡报晓
日期:2017-02-08 10:33:212017金鸡报晓
日期:2017-01-10 15:13:2915-16赛季CBA联赛之深圳
日期:2016-12-15 17:55:53C
日期:2016-10-25 16:00:1515-16赛季CBA联赛之新疆
日期:2016-07-21 14:02:0415-16赛季CBA联赛之江苏
日期:2016-06-30 12:15:04shanzhi
日期:2016-06-17 17:59:31平安夜徽章
日期:2015-12-26 00:06:30
33 [报告]
发表于 2015-09-02 00:29 |只看该作者
回复 32# heguangwu

    嗯,现在大数据很火,原因在于企业累积了海量数据,而且这些海量数据并没有被利用起来。而大数据真正价值在于对未来的预测,将大量数据收集起来进行挖掘分析,从而预测出未来会发生什么。大数据不过是对过往事实的强化,并没有跳出原有的盒子去真正创新。如果过分的依靠机械的进化而不是破坏性的创新。由于是对过往事实的强化,所以很容易将相关性误解成因果性,这无疑是非常可怕的。如果数据不全,导致错误的预测,不可避免地成为“黑天鹅事件”。
      数据挖掘分析通过算法来更好地理解数据,在数据上进行基于各种算法的计算,做进一步预测性分析。根据分析和数据挖掘的结果做出一些预测性的判断,实现一些高级别数据分析的需求。用于挖掘的算法很复杂,算法的设计很重要,一旦算法设计不合理,用于分析的数据样本数量不够,或者数据样本有误,数据挖掘的结果将导致错误的预测。因此大数据预测,选择正确的算法很重要。

论坛徽章:
8
亥猪
日期:2014-02-09 10:55:252015小元宵徽章
日期:2015-03-06 15:57:20数据库技术版块每日发帖之星
日期:2015-06-08 22:20:00综合交流区版块每日发帖之星
日期:2015-06-14 22:20:002015亚冠之阿尔沙巴布
日期:2015-09-01 20:23:45IT运维版块每日发帖之星
日期:2015-09-04 06:20:00IT运维版块每日发帖之星
日期:2015-11-04 06:20:00IT运维版块每日发帖之星
日期:2015-12-04 06:20:00
34 [报告]
发表于 2015-09-02 08:29 |只看该作者
大数据现在到处都在说啊,可是有几个公司的数据量能够称得上是大数据呢,好多在我看,用excel就能搞定的,还非得说要搞大数据,就是个笑话啊

论坛徽章:
18
2015年迎新春徽章
日期:2015-03-04 10:16:53操作系统版块每日发帖之星
日期:2016-05-11 06:20:0015-16赛季CBA联赛之佛山
日期:2016-05-06 22:28:4415-16赛季CBA联赛之广夏
日期:2016-04-22 23:24:00操作系统版块每日发帖之星
日期:2016-04-21 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44操作系统版块每日发帖之星
日期:2016-02-03 06:20:00IT运维版块每日发帖之星
日期:2016-01-31 06:20:00IT运维版块每日发帖之星
日期:2016-01-30 06:20:00IT运维版块每日发帖之星
日期:2016-01-24 06:20:00IT运维版块每日发帖之星
日期:2016-01-23 06:20:00操作系统版块每日发帖之星
日期:2015-11-26 06:20:00
35 [报告]
发表于 2015-09-06 17:00 |只看该作者
我想聊聊大数据下的个人隐私安全,可是好像没人在意...

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
36 [报告]
发表于 2015-09-07 09:35 |只看该作者
安全是一个很小的圈子,其实我也想聊这个,奈何不懂
回复 35# SeAL80s


   

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每月发帖之星
日期:2015-09-11 19:30:52IT运维版块每周发帖之星
日期:2015-09-11 19:20:31IT运维版块每日发帖之星
日期:2015-08-26 06:20:00每日论坛发贴之星
日期:2015-08-20 06:20:00IT运维版块每日发帖之星
日期:2015-08-20 06:20:002015年辞旧岁徽章
日期:2015-03-03 16:54:15金牛座
日期:2014-05-04 16:58:09双子座
日期:2013-12-17 16:44:37辰龙
日期:2013-11-22 15:20:59狮子座
日期:2013-11-18 22:55:08射手座
日期:2013-11-12 10:54:26
37 [报告]
发表于 2015-09-10 10:11 |只看该作者
分享自己学习大数据的一些经历

个人的一点点经验,先把环境跑起来,hadoop。 然后会简单测试一些类似于hello world的小应用,接着看看hadoop 权威指南,因为在之前的实践中对理论技术的了解不够多,籍此能加深理解并能了解其中个味。接着就是做项目啦,没有项目的支持,对大数据的理解还是处于概念层的。比如跑一些etl。逐步的提搞,大数据的前提是java。对java的基础不能太差,还有就是JVM原理之类的,因为遇到问题的时候你有可能会看代码。不懂就傻xx了。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP