免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6403 | 回复: 1

大数据峰会分享(3月7日) [复制链接]

论坛徽章:
4
金牛座
日期:2014-08-21 12:58:152015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之本尤德科
日期:2015-05-22 00:05:18数据库技术版块每日发帖之星
日期:2015-06-23 22:20:00
发表于 2014-03-10 12:19 |显示全部楼层
观点的碰撞
观点一: 大数据要形成多源数据关联,价值才能快速,甚至指数级提升效果。



观点二: 大数据可以追求完美,例如做出更完美的玫瑰;反对者问何为完美,为啥要做完美而不是帮助人们更幸福呢?



观点三:  算法模型在有的时候不重要了,重要的是大数据,举例气象预报,一战时发明的一个算法,当时没法达到预期的目标,而现在还是用这个算法,提前3天预报准确率达到95%



观点四: 物理世界有边界,大数据世界没有边界,这是大数据革命的基础,金融货币也可能因此而改变



观点五: 大数据隐私和权力问题,观点是你既然因为自身需要,暴露出来个人信息,本身就算同意了隐私给了互联网公司,你接受了他们的服务。



观点六: 高唱大数据的大都是市场营销的,因为大数据效果更直接。



总结观点:  1、大数据既不断提高一直在进行的计算领域,也可以开创新的“颠覆”方向;2、大数据到底目的是什么,其实没必要纠结,每个人在大数据时代愿景都不同,只要能达成自己愿景,就是好的大数据应用;3、效果最直接的,大数据从业者们都在挤着进入这个领域,这是好事,一是容易见效果,二是说明这是冰山一角,大数据潜力巨大;4、大数据没有边界,思考方式也要没有边界,才能创新,当然落地的过程是漫长的试错过程;



个人观点: 1、大数据还有很多利益问题没有解决,是阻碍大数据更快速发展的主要障碍,例如共享,如果很多单位认为有风险不共享,大数据总有些缺失;2. 大数据获取之后ROI问题,如果你投入20个人日采集1年100T的数据,只是听说有用,理性的决策者会支持你就这样去搜集么? 3、算法模型还是需要尝试才能让大数据效果更优,老的算法是很好的基石;4、业务应用场景设计仍然是大数据的短板,目前主要领域是营销,说是潜力大,说白了,业务场景的设计仍然很苍白,对营销以外的事情帮助还不够多





关于大数据联合
联合的力量,在大数据媒体应用的介绍上已经说得比较清楚了,有数据为证,在解决了数据从无到有的基础上,通过大数据多渠道联合,效果还可以再翻倍。



不如我来例举一个场景说明,假设你知道张三的PC机上基本信息,例如Cookie,浏览过什么,时间和时长,这个时候你要推荐其实很难的,往往容易出现浏览过棺材,你就推荐棺材的无意义场景;如果大数据联合,你从第三方获知这些人的Cookie曾经浏览过某些专业网站,而且深度时长较长,那么定性就会更精准,例如这人喜欢看足球网站,还喜欢评论,这个时候结合他之前浏览运动服饰,你可以毫不犹豫判断他需要的是足球服饰可能性大;如果再关联社交网络,可以把他打球友标签的人,也推荐上述商品。



记住,上述关联仅仅是一条线,一个人有多个爱好,多个圈子,那么是否是指数级呢?如果扣除衰减、扣除人群重复效应,多重大数据关联,效果翻倍是很正常的事。







大数据是虚拟与实体的革命
实体经济很多都是千百年来的根基,要动有很大难度,例如铺面,那就得位置为王,铺面位置稍差一点,效果可能完全不一样。



论坛中提到公交卡解决了大量角票问题,网上交易解决了现钞问题。看起来和大数据没啥关系,其实是业务流程改变中,大数据需要解决原来实体中避免了的风险、体验等问题。



在电商说得最多的O2O,主要是本地化消费、零售、旅游等三大类,例如本地化中的电影票是可以网上买的,只是要到现场看电影,网上替代了现场买票交易,订座系统连接到网上,其证明标志是手机的内容,旅游中门票、酒店团购和这相似,零售O2O也可以采用,而机票是靠**; 这就解决了实体时代中“票”的证明问题



还有2个大问题要解决,风险、流量。网络有盗用风险,手机内容盗用就成为了风险,所以很多O2O仍然是当场付费,这样风险小点。那么流量呢,由于没有店铺的位置口岸问题,流量入口问题其实也难以解决。



后来商家想到了买流量、线上线下广告和二维码等多个方式,就是想解决流量入口问题,还有新兴的社会化媒体什么的。其实社会化口碑传播是不错的方式,但既然是口碑,效果就难以量化,你也就不知道哪个人是哪个人介绍或影响的,即使你让他填写这个资料,别人也不一定愿意。



论坛中其实只提到了可行性,但没提到具体怎么操作实现?这也是摆给大家想象的空间了,O2O最终链接关键还在手机等移动设备,这是大数据未来发挥的主要战场。





大数据下的指标与决策
传统BI,甚至传统BI之前,就有指标,也有看指标决策这种事情了,那么在BI出现后,有了些提升,大数据时代下,有何本质提升么?



在大数据论坛,无论美国公司提到的用房产指标来判断宏观经济,从而影响股票投资决策, 还是阿里企业活跃指标,都有指标、决策。



在小数据时代,指标是通过抽样数据获取,并用一些模型来完成指标的统计,并通过指标决策,我想在现代经济学体系下,美国公司提到的案例,在小数据时代也是类似原理吧,只不过大数据条件下准确率更高,他提到在N多次中只漏了一次(忘记具体次数了),说明大数据时代下,这样的更可信,可以让投资者更放心地决策来获得更大的收益。当然同时也在警告投资者,这可不是100%的,可不要下血本玩命。



所以大数据时代指标与决策,这个经济和管理学体系内,并无学术上的创新,仅仅是准确率大幅提升。但这已经足够了,经济社会,大家不都看着Money为主嘛。

论坛徽章:
0
发表于 2014-07-24 17:38 |显示全部楼层
大数据的话我觉得有一个网址做的还不错,http://bosonnlp.com/感兴趣的同行可以去试试,感觉准确率很高的。可以一站式解决你的中文语义分析需求。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP