免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: send_linux
打印 上一主题 下一主题

[其他] 大数据分析:如何做到点数成金?(获奖名单已公布-10-24) [复制链接]

论坛徽章:
3
CU大牛徽章
日期:2013-09-18 15:16:55CU大牛徽章
日期:2013-09-18 15:18:22CU大牛徽章
日期:2013-09-18 15:18:43
11 [报告]
发表于 2013-09-23 20:39 |只看该作者
大数据是现实
其实大数据的关键是大分析
因为数据太多所以真相反而被数据所淹没了
大分析就像是海里寻针一样
而工具我看则是那寻针的磁石lollol

论坛徽章:
3
CU大牛徽章
日期:2013-09-18 15:15:15CU大牛徽章
日期:2013-09-18 15:15:45CU十二周年纪念徽章
日期:2013-10-24 15:41:34
12 [报告]
发表于 2013-09-23 23:41 |只看该作者
本帖最后由 西山壹号院 于 2013-09-23 23:42 编辑

                        难题主要在于数据的采集、存储、检索、共享、分析和数据可视化????

谷歌公司,想的超前啊,推出BigTable?替代了GFS?
我想说的是,BigData数据其实就是一种不该存在的现实,数据冗余不说,利弊都有。但是就目前的海量信息,我们的解决方案得不到肯定。
首先说,我国古代发明了造纸术,取代了竹简?无论从存储体积,还是存储时限(墨水的研究也到了一定高度)都增加了不止一个数量级?
再者说,纸质版到软磁碟、磁带、光盘、U盘、硬盘、移动硬盘、超大量级硬盘每一种进步都在跟随信息社会的脚步,不是吗?
古代,竹简尚可解决的问题,到了现今,耗费了无数脑细胞在研究?
分门别类的做法已经用到极致了吗?也许吧。。。。
我想了一种方法,也算是跟随云技术的一种潮流吧。。。我们自己挖掘类似于一条黄河或者一条长江那样的数据结构二级模型,一级模型当然就是汇聚一处的大海了,紧接着将黄河长江细分为三级数据结构存储模型,这样一级级细细分化,就到了大海水资源的源头,即,每家每户每一B。然而我们需要的信息就像雨水(整个生态环境的信息汇集)一样或者地下水(本地信息冗余)那样即取即用。      

         其中个人、公司、云服务计算提供商、服务器厂商(数据存储),每个人扮演的角色都很重要,我们就是这一生态体系的一员,所谓爱护环境人人有责嘛。这种体系涉及千千面面细小的环节,需要我们深思熟虑,每一个拐点都能使一个公司发展起来!让我们heigh起来吧,我们正处于这一场革命之中!
   


      我很喜欢看书,我对于这一领域抱有强烈的感情!!!请活动领导者赐予我新书吧!!!!

                                                             最后感谢CU论坛和活动提供者给我这次发言的机会

论坛徽章:
10
CU大牛徽章
日期:2013-05-20 10:44:54数据库技术版块每日发帖之星
日期:2015-06-09 22:20:00IT运维版块每日发帖之星
日期:2015-06-05 22:20:00亥猪
日期:2014-08-23 14:52:27摩羯座
日期:2013-11-29 18:02:31CU十二周年纪念徽章
日期:2013-10-24 15:41:34CU大牛徽章
日期:2013-05-20 10:45:31CU大牛徽章
日期:2013-05-20 10:45:24CU大牛徽章
日期:2013-05-20 10:45:13综合交流区版块每日发帖之星
日期:2016-02-12 06:20:00
13 [报告]
发表于 2013-09-24 12:45 |只看该作者
回复 1# send_linux
大数据的价值建立在:1、科学的数据分析模型;2、专业的研发与及运维团队;3、建立数据分析引擎;4、适合企业业务的分析模型;5、适合企业自身的技术

   

论坛徽章:
26
2015亚冠之胡齐斯坦钢铁
日期:2015-06-25 21:40:202015亚冠之柏斯波利斯
日期:2015-08-31 17:03:192015亚冠之柏斯波利斯
日期:2015-11-07 13:10:00程序设计版块每日发帖之星
日期:2015-11-10 06:20:00每日论坛发贴之星
日期:2015-11-10 06:20:00程序设计版块每日发帖之星
日期:2015-11-26 06:20:00程序设计版块每日发帖之星
日期:2015-12-02 06:20:00黄金圣斗士
日期:2015-12-07 17:57:4615-16赛季CBA联赛之天津
日期:2015-12-23 18:34:14程序设计版块每日发帖之星
日期:2016-01-02 06:20:00程序设计版块每日发帖之星
日期:2016-01-06 06:20:00每日论坛发贴之星
日期:2016-01-06 06:20:00
14 [报告]
发表于 2013-09-24 14:52 |只看该作者
大数据到底是什么?
不错的话题。

论坛徽章:
2
IT运维版块每日发帖之星
日期:2015-06-26 22:20:00IT运维版块每日发帖之星
日期:2015-06-29 22:20:00
15 [报告]
发表于 2013-09-24 15:45 |只看该作者
大家好,这个话题很有意思,我也来凑个热闹。
大数据的好处经常提及我就不说了,我想谈谈反思,算作冷思考吧:
1、大数据源于一个概念,但发展至今已经形成了以技术为基础的商业体系,并慢慢形成产业生态圈。这与前几年的“云计算”发展脉络如出一辙。云计算和大数据热的背后,是行业的萧条。回想十多年前IT蓬勃发展的黄金时代,不需概念提携就已然能够迅猛发展。如今,IT产业步入中年期,不来两剂猛药,怕是步履太过缓慢。
2、大数据的实践,并非无源之水天上来,它依赖于企事业已有的信息化基础。我国很多企业和政府机构中,电脑是买了,系统是上了,但太过低端,大多都是只是业务流程的无纸化复刻而已,无纸化是信息化最低端的一个层次,不过实事求是地说,这就是现状。对于“大”数据而言,这些部门内的数据就是“小”数据。数据虽小,但也有价值,遗憾的是基本的完整统计分析功能都不一定具备,更高级的智能分析就更别提了;数据虽小,但如果部门内部的数据能够汇合起来,交叉关联,就能变成“中”数据,部门间的数据一起汇总,就能形成“大”数据。我国幅员辽阔,人口众多,办事机构数量也为世界之首。数据量多得是,但到处都是孤岛,处处都是竖井。大数据概念虽热,但更需脚踏实地稳步前行,不能刚学会走、立刻就想跑。
3、大数据的运维需要复合型人才,中国教育提供的“合格产品”太少。既懂计算机又懂管理还要精通统计,同时具有良好的表达和操作能力,这样的人数量稀少,市面上有两类才子:一类是专才,只能独挡一面;一类是通才,夸夸其谈,似乎什么都会,啥都能干。其实,大数据之路,没有捷径,需要吃苦、能够实干。

    就先谈这些吧。欢迎大家的批评和建议。

论坛徽章:
49
15-16赛季CBA联赛之福建
日期:2016-06-22 16:22:002015年亚洲杯之中国
日期:2015-01-23 16:25:12丑牛
日期:2015-01-20 09:39:23未羊
日期:2015-01-14 23:55:57巳蛇
日期:2015-01-06 18:21:36双鱼座
日期:2015-01-02 22:04:33午马
日期:2014-11-25 09:58:35辰龙
日期:2014-11-18 10:40:07寅虎
日期:2014-11-13 22:47:15申猴
日期:2014-10-22 15:29:50摩羯座
日期:2014-08-27 10:49:43辰龙
日期:2014-08-21 10:47:58
16 [报告]
发表于 2013-09-24 16:23 |只看该作者
五岳之巅 发表于 2013-09-24 15:45
大家好,这个话题很有意思,我也来凑个热闹。
大数据的好处经常提及我就不说了,我想谈谈反思,算作冷思考 ...


欢迎专家过来分享,呵呵

论坛徽章:
1
17 [报告]
发表于 2013-09-24 16:48 |只看该作者
1、您目前所在的企业是否面对大数据的难题?
    前任何两家公司都存大大数据问题,目前在职企业不存在。关键问题是数据的沉淀。企业对数据不关心,同一解决方案几年换几家。这样下来,数据几乎没有。

2、目前的大数据形式下,技术和规范哪个更重要?
     大数据形式下,技术是手段,而规范是目的,所以这两个概念不能单独拿开来说。从大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点。且涉及到的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据开展相关工作,都需要技术和规范。所以二者相辅相成,而且二者是统一的。
  
3、谈谈您目前所在行业的大数据形式和业内解决方案
     现在所处于快速消费品行业,对于行业的大数据形式主要表现在企业内部的经营交易信息、商品物流信息两个方面。
     行业内的的解决方案国内目前均不成熟。从国内目前对大数据的运用主要表现在数据分析、数据挖掘等两个方面,企业信息化解决方案厂商可与需求企业共同开发适应自身的数据分析、数据挖掘工具,企业管理让数据说话,为企业经营管理服务。

论坛徽章:
0
18 [报告]
发表于 2013-09-24 17:24 |只看该作者
刚才一个朋友我觉得我是我想问的,什么样的是大数据?是真正的数据内容?还是数据文件的大小。
比如我的数据库里面的记录有20billion ,这个算大数据?
比如我的某个日志文件的大小超过了5G,这个算大数据?

论坛徽章:
1
19 [报告]
发表于 2013-09-25 07:59 |只看该作者
a.a 发表于 2013-09-24 17:24
刚才一个朋友我觉得我是我想问的,什么样的是大数据?是真正的数据内容?还是数据文件的大小。
比如我的数 ...


大数据主要是针对数据文件,而日志数据则为运维的范畴

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
20 [报告]
发表于 2013-09-25 14:53 |只看该作者
1、您目前所在的企业是否面对大数据的难题?
估计真正意义上的大数据还没有吧,就是对比较多的一些用户操作进行分析来判断和预测用户行为,对一些系统日志进行分析来判断系统工作是否正常和符合预期。
2、目前的大数据形式下,技术和规范哪个更重要?
不知道这个规范是不是我理解的“标准”的意思,技术应该是为规范服务的,规范就像是一个方向,没有方向,技术实现的再完美那也是错的,所谓南辕北辙就是走错方向了嘛。
3、谈谈您目前所在行业的大数据形式和业内解决方案
没用到,没什么接触。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP