免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1571 | 回复: 3
打印 上一主题 下一主题

[MongoDB] 目前存储用的分布式mongodb, 现在想对mongo里的数据做处理 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-08-29 09:39 |只看该作者 |倒序浏览
目前存储用的分布式mongodb, 现在想对mongo里的数据做处理,怎么做比较好。之前讨论过换hadoop,成本比较大。

论坛徽章:
3
fulanqi
日期:2016-06-17 17:54:25JAVA
日期:2016-10-25 16:18:31码神
日期:2017-03-28 10:27:34
2 [报告]
发表于 2016-08-29 11:09 |只看该作者
想问一下,想对mongo里的数据做处理,是怎么个处理法

论坛徽章:
0
3 [报告]
发表于 2016-08-29 12:20 |只看该作者
回复 2# jelon521

简单字符串处理和 去重处理,考虑过分片后去重,没想好怎么分片,因为临界线也可能是重复的。 数据量大概2500万


论坛徽章:
3
fulanqi
日期:2016-06-17 17:54:25JAVA
日期:2016-10-25 16:18:31码神
日期:2017-03-28 10:27:34
4 [报告]
发表于 2016-08-29 14:14 |只看该作者
貌似遇到过mongodb里有重复,都是手动弄的
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP