免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 15839 | 回复: 36

[其他] 由大数据引发的概念潮,关于“大数据”你想聊点啥? [复制链接]

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
发表于 2015-08-11 13:26 |显示全部楼层
获奖详情:http://bbs.chinaunix.net/thread-4187747-1-1.html

话题背景
大数据已经无处不在,无论你在哪个行业,开口必谈大数据。各位从事大数据相关工作的筒子,从最开始的DBMS、BI到后面大红大紫的分布式存储、NoSQL、NewSQL、MapReduce、Spark、BlinkDB,无论是在存储、分析、计算、甚至可视化方面,或多或少遇到过一些揪心的问题:有配置的问题,有代码开发的问题,甚至有的是版本兼容性的问题等。本次话题将集中于讨论大数据相关的问题。



讨论话题(包括但不限于)
1. 遇到的比较头疼的问题是什么,怎么解决的(Google直接解决的免谈)?
2. 是否深入研究过大数据的某一个组件或工具,直接从源代码层次来解决问题?
3. 从什么渠道了解新的技术,SIGMOD、VLDB、Hadoop submit、spark submit或其它,这些新技术怎么应用到项目?
4. 分享自己学习大数据的一些经历

欢迎任选一个到多个话题畅所欲言。




讨论时间:2015年8月11日-2015年9月11日



活动奖励:
活动结束后将选取5名讨论精彩的童鞋,可任意选取以下经典技术图书一本。



奖品简介:
人件 A.jpg
样章试读:人件  文前      人件  正文

算法精解 A.jpg
样章试读:算法精解  文前         算法精解01-03

算法心得 A.jpg
样章试读:算法心得:高效算法的奥秘   文前        算法心得:高效算法的奥秘  1-3

NoSQL精粹 A.jpg
试读样章:NoSQL精粹 第一章      NoSQL精粹 第二章    NoSQL精粹  第三章

设计原本 A.jpg
样章试读:设计原本 01        设计原本 02        设计原本 03



征集下期话题:
参与此话题的讨论的同学,有兴趣的可自选主题, 组织下期讨论活动。下期书单早曝光:
  《领域特定语言》   《 设计原本:计算机科学巨匠Frederick P. Brooks的反思(经典珍藏)》    《软件驱魔:调试和优化遗留代码的艺术》  《修改代码的艺术》  《Windows运行时编程权威指南.rar》







论坛徽章:
19
处女座
日期:2014-07-18 14:50:5415-16赛季CBA联赛之北京
日期:2019-09-16 15:39:1415-16赛季CBA联赛之上海
日期:2019-09-15 15:29:0415-16赛季CBA联赛之山西
日期:2017-03-09 10:58:232017金鸡报晓
日期:2017-02-08 10:33:212017金鸡报晓
日期:2017-01-10 15:13:2915-16赛季CBA联赛之深圳
日期:2016-12-15 17:55:53C
日期:2016-10-25 16:00:1515-16赛季CBA联赛之新疆
日期:2016-07-21 14:02:0415-16赛季CBA联赛之江苏
日期:2016-06-30 12:15:04shanzhi
日期:2016-06-17 17:59:31平安夜徽章
日期:2015-12-26 00:06:30
发表于 2015-08-11 15:32 来自手机 |显示全部楼层
新活动先支持一个。

论坛徽章:
13
数据库技术版块每日发帖之星
日期:2015-08-06 06:20:002017金鸡报晓
日期:2017-02-08 10:39:422017金鸡报晓
日期:2017-01-10 15:13:29极客徽章
日期:2016-12-07 14:08:02JAVA
日期:2016-10-25 16:01:09luobin
日期:2016-06-17 17:46:362016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之天津
日期:2015-12-16 22:35:03黄金圣斗士
日期:2015-11-24 10:43:13IT运维版块每日发帖之星
日期:2015-10-09 06:20:002015亚冠之广州恒大
日期:2015-09-21 21:40:222015七夕节徽章
日期:2015-08-21 11:06:17
发表于 2015-08-11 18:00 |显示全部楼层
大数据啊,能用上的公司很少......

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
发表于 2015-08-11 20:58 |显示全部楼层
大数据只是一个名词,何谓大数据,假设单机器处理能力10G,那么大于10G就是大数据
并不是说数据量大就一定是大数据,个人认为大数据的核心是Value,哪怕用excel分析也可以
当前的趋势是数据存储和分析代价越来越小,所以能保存的数据的广度和分析的深度都在扩大,之前处于成本考虑不保存分析的数据现在也开始作为一个参考的维度了
对企业而言,如何从更多的数据集分析出更有价值的东西才是他们关心的东西,即使是小企业有的也开始考虑了
回复 3# chenxing2


   

论坛徽章:
19
处女座
日期:2014-07-18 14:50:5415-16赛季CBA联赛之北京
日期:2019-09-16 15:39:1415-16赛季CBA联赛之上海
日期:2019-09-15 15:29:0415-16赛季CBA联赛之山西
日期:2017-03-09 10:58:232017金鸡报晓
日期:2017-02-08 10:33:212017金鸡报晓
日期:2017-01-10 15:13:2915-16赛季CBA联赛之深圳
日期:2016-12-15 17:55:53C
日期:2016-10-25 16:00:1515-16赛季CBA联赛之新疆
日期:2016-07-21 14:02:0415-16赛季CBA联赛之江苏
日期:2016-06-30 12:15:04shanzhi
日期:2016-06-17 17:59:31平安夜徽章
日期:2015-12-26 00:06:30
发表于 2015-08-12 08:09 来自手机 |显示全部楼层
我建议根据每一期的数据,大家自由发挥比较好,例如这一期可以讨论算法,软件管理,数据库。

论坛徽章:
140
2015年亚洲杯之日本
日期:2015-04-28 13:32:012015年亚洲杯之朝鲜
日期:2015-05-06 10:16:442015年亚洲杯之日本
日期:2015-05-06 10:21:342015年亚洲杯纪念徽章
日期:2015-05-13 17:16:442015亚冠之北京国安
日期:2015-05-13 17:18:292015亚冠之鹿岛鹿角
日期:2015-05-13 17:19:062015亚冠之德黑兰石油
日期:2015-05-27 16:47:402015亚冠之塔什干棉农
日期:2015-05-28 15:24:122015亚冠之卡尔希纳萨夫
日期:2015-06-01 13:52:392015亚冠之柏斯波利斯
日期:2015-06-04 17:37:292015亚冠之阿尔纳斯尔
日期:2015-06-16 11:31:202015亚冠之塔什干火车头
日期:2015-06-23 10:12:33
发表于 2015-08-12 10:19 |显示全部楼层
shenlanyouyu,这个建议很好,大家可以按照这个聊哈回复 5# shenlanyouyu


   

论坛徽章:
40
水瓶座
日期:2013-08-15 11:26:422015年辞旧岁徽章
日期:2015-03-03 16:54:152015年亚洲杯之乌兹别克斯坦
日期:2015-03-27 14:01:172015年亚洲杯之约旦
日期:2015-03-31 15:06:442015亚冠之首尔
日期:2015-06-16 23:24:37IT运维版块每日发帖之星
日期:2015-07-01 22:20:002015亚冠之德黑兰石油
日期:2015-07-08 09:32:07IT运维版块每日发帖之星
日期:2015-08-29 06:20:00IT运维版块每日发帖之星
日期:2015-08-29 06:20:00IT运维版块每日发帖之星
日期:2015-10-10 06:20:00IT运维版块每日发帖之星
日期:2015-10-11 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
发表于 2015-08-12 11:15 |显示全部楼层
靠谱的活动 先支持下

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:54:45
发表于 2015-08-12 11:24 |显示全部楼层
从什么渠道了解新的技术,SIGMOD、VLDB、Hadoop submit、spark submit或其它,这些新技术怎么应用到项目?

这些新技术一个都没了解过。。有点失败。。。。

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
发表于 2015-08-12 12:57 |显示全部楼层
可能你之前不是这个做这方面的东东,所以很正常
回复 8# zymh_zy


   

论坛徽章:
13
数据库技术版块每日发帖之星
日期:2015-08-06 06:20:002017金鸡报晓
日期:2017-02-08 10:39:422017金鸡报晓
日期:2017-01-10 15:13:29极客徽章
日期:2016-12-07 14:08:02JAVA
日期:2016-10-25 16:01:09luobin
日期:2016-06-17 17:46:362016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之天津
日期:2015-12-16 22:35:03黄金圣斗士
日期:2015-11-24 10:43:13IT运维版块每日发帖之星
日期:2015-10-09 06:20:002015亚冠之广州恒大
日期:2015-09-21 21:40:222015七夕节徽章
日期:2015-08-21 11:06:17
发表于 2015-08-12 18:31 |显示全部楼层
回复 4# heguangwu


    你这么一说,感觉我一直在从事大数据分析了

之前公司就做一个ERP,然后加了一套功能:
业绩分析、贡献度、销售构成、ABC分析、冻销分析、
商品趋势、销售速度、业绩趋势
百分率损益、


等等,有好多,之前客户公司是用excel做分析,现在我们提供软件分析,那我也是一直在做大数据处理了,话说我就写SQL的....

个人嚼的,怎么得用个聚类、推荐、语言识别、特征识别、朴素贝叶斯算法与交叉验证等之类的,才好玩...

话说回来,现在的大数据的一些开发方式及其一些开源框架,就现在的一大片公司的那点数据量根本用不上

用了也就是大炮打蚊子,没一点用,搞不好还不如传统手段来的高效。所以能用上个nosql数据库感觉都是超前一点的了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2019中国系统架构师大会

【数字转型 架构演进】SACC2019中国系统架构师大会
2019年10月31日~11月2日第11届中国系统架构师大会(SACC2019)将在北京隆重召开。四大主线并行的演讲模式,1个主会场、20个技术专场、超千人参与的会议规模,100+来自互联网、金融、制造业、电商等领域的嘉宾阵容,将为广大参会者提供一场最具价值的技术交流盛会。




----------------------------------------

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP