免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: heguangwu
打印 上一主题 下一主题

[其他] 由大数据引发的概念潮,关于“大数据”你想聊点啥? [复制链接]

论坛徽章:
42
19周年集字徽章-周
日期:2019-10-14 14:35:31平安夜徽章
日期:2015-12-26 00:06:30数据库技术版块每日发帖之星
日期:2015-12-01 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43IT运维版块每日发帖之星
日期:2015-08-17 06:20:00寅虎
日期:2014-06-04 16:25:27狮子座
日期:2014-05-12 11:00:00辰龙
日期:2013-12-20 17:07:19射手座
日期:2013-10-24 21:01:23CU十二周年纪念徽章
日期:2013-10-24 15:41:34IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
1 [报告]
发表于 2015-08-13 20:40 |显示全部楼层
我现在的需求有两类,感觉都和大数据有关,但是有些区别。
一类是插入为主,例如一天500G的日志分析和查询.  这个目前用的ES
一类是更新为主, 一天1亿次的更新,但总记录数在500w左右。  这个之前用的oracle,后来换成了redis。但是感觉不太好用。
现在用什么框架最合适?
峰值插入/更新速度  5000~10000QPS就可以
查询速度  不用太高。 秒级就行。
spark?elasticsearch?solr?
还是mongodb,mysql+handlesocket?

论坛徽章:
42
19周年集字徽章-周
日期:2019-10-14 14:35:31平安夜徽章
日期:2015-12-26 00:06:30数据库技术版块每日发帖之星
日期:2015-12-01 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43IT运维版块每日发帖之星
日期:2015-08-17 06:20:00寅虎
日期:2014-06-04 16:25:27狮子座
日期:2014-05-12 11:00:00辰龙
日期:2013-12-20 17:07:19射手座
日期:2013-10-24 21:01:23CU十二周年纪念徽章
日期:2013-10-24 15:41:34IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
2 [报告]
发表于 2015-08-14 09:28 |显示全部楼层
目前大数据量的查询需求主要是ES实现的。主要遇到的一些问题也是ES的部署使用相关的,比如参数调整,索引规划等,还有就是感觉ES的写入性能没有想象中高。
ES做一个大集群,和分开几个集群,写入性能会不会有不同?

redis的主要问题是它是一个KV型的,不是文档型的,不能使用主键之外的查询。这就需要自己维护多个表。这样相当于降低了性能。
也许用lua做一些类似trigger的操作,能有提升。

论坛徽章:
42
19周年集字徽章-周
日期:2019-10-14 14:35:31平安夜徽章
日期:2015-12-26 00:06:30数据库技术版块每日发帖之星
日期:2015-12-01 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43IT运维版块每日发帖之星
日期:2015-08-17 06:20:00寅虎
日期:2014-06-04 16:25:27狮子座
日期:2014-05-12 11:00:00辰龙
日期:2013-12-20 17:07:19射手座
日期:2013-10-24 21:01:23CU十二周年纪念徽章
日期:2013-10-24 15:41:34IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
3 [报告]
发表于 2015-08-14 09:41 |显示全部楼层
还有ES和hadoop的选型问题。
实际项目里,用户经常说已有建好一套hadoop大数据平台了,就不要再搞一套了。
ES使用HDFS有没有实际的使用?性能是不是会差很多?感觉不靠谱。
或者说,基于hadoop平台,现在有没有和ES类似的准实时搜索引擎?

论坛徽章:
42
19周年集字徽章-周
日期:2019-10-14 14:35:31平安夜徽章
日期:2015-12-26 00:06:30数据库技术版块每日发帖之星
日期:2015-12-01 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43IT运维版块每日发帖之星
日期:2015-08-17 06:20:00寅虎
日期:2014-06-04 16:25:27狮子座
日期:2014-05-12 11:00:00辰龙
日期:2013-12-20 17:07:19射手座
日期:2013-10-24 21:01:23CU十二周年纪念徽章
日期:2013-10-24 15:41:34IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
4 [报告]
发表于 2015-08-14 22:40 |显示全部楼层
本帖最后由 laputa73 于 2015-08-14 23:11 编辑

回复 19# heguangwu


    商业方案是不优先考虑的,
    voltdb的社区版只能玩玩,持久化,集群,ha特性都没有。
   巨杉准备了解一下,上次在大数据峰会有看到它的介绍,有些印象,那时好像还没有开源。

论坛徽章:
42
19周年集字徽章-周
日期:2019-10-14 14:35:31平安夜徽章
日期:2015-12-26 00:06:30数据库技术版块每日发帖之星
日期:2015-12-01 06:20:002015亚冠之首尔
日期:2015-11-04 22:25:43IT运维版块每日发帖之星
日期:2015-08-17 06:20:00寅虎
日期:2014-06-04 16:25:27狮子座
日期:2014-05-12 11:00:00辰龙
日期:2013-12-20 17:07:19射手座
日期:2013-10-24 21:01:23CU十二周年纪念徽章
日期:2013-10-24 15:41:34IT运维版块每日发帖之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之新疆
日期:2016-06-07 14:10:01
5 [报告]
发表于 2015-08-14 23:14 |显示全部楼层
还有TSDB,有没有好的方案推荐?这个不算海量数据,不过也挺多的。
influxdb这个还不成熟,集群方案还不可用。
现在也是直接拿es当tsdb使。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP