免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: titansword2000
打印 上一主题 下一主题

天量数据如何处理? [复制链接]

论坛徽章:
0
11 [报告]
发表于 2012-02-24 14:09 |只看该作者
yulihua49 发表于 2012-02-24 11:16
可以考虑NOSQL的文件处理。

ORACLE的hadoop技术。


看来需要学习下这个方面的东东。

论坛徽章:
0
12 [报告]
发表于 2012-02-24 14:09 |只看该作者
blackuhlan 发表于 2012-02-24 11:19
实时性要求怎么样?


实时性不是很强。

论坛徽章:
0
13 [报告]
发表于 2012-02-24 14:11 |只看该作者
回复 12# titansword2000


    那扔数据库里慢慢处理,想怎么处理怎么处理,还不简单啊?

论坛徽章:
0
14 [报告]
发表于 2012-02-24 14:12 |只看该作者
本帖最后由 titansword2000 于 2012-02-24 17:55 编辑
egmkang 发表于 2012-02-24 12:50
我去,一秒钟aK,b个站点,就是a*b不到数据,也才cK,还叫个P天量数据
单机就能搞定.你当CPU是2啊,这么一点 ...


可能我没表达清楚,不好意思。数据是每秒cK,共一天的数据,也就是cK*3600秒*24小时,远远超过内存大小。

论坛徽章:
0
15 [报告]
发表于 2012-02-24 14:14 |只看该作者
blackuhlan 发表于 2012-02-24 14:11
回复 12# titansword2000


问题是需要对这些数据进行复杂运算,数据库不知能否?

论坛徽章:
0
16 [报告]
发表于 2012-02-24 14:15 |只看该作者
本帖最后由 titansword2000 于 2012-02-24 17:56 编辑
egmkang 发表于 2012-02-24 12:50
我去,一秒钟aK,b个站点,就是a*b不到数据,也才cK,还叫个P天量数据
单机就能搞定.你当CPU是2啊,这么一点 ...


还有,目前的条件确实只有单机

论坛徽章:
0
17 [报告]
发表于 2012-02-24 14:21 |只看该作者
回复 15# titansword2000


    数据库是拿给你做中转的,计算的事情还是不要给他做。其实也不是做不到,oracle可以外调C或者JAVA代码。看你怎么设计!

论坛徽章:
0
18 [报告]
发表于 2012-02-24 15:48 |只看该作者
具体要做什么处理?线性扫描?索引查询?要求不同,方案差距就大了。要是只做词频统计,至多几百兆内存就足够做实时分析了。

论坛徽章:
0
19 [报告]
发表于 2012-02-24 15:59 |只看该作者
狗蛋 发表于 2012-02-24 15:48
具体要做什么处理?线性扫描?索引查询?要求不同,方案差距就大了。要是只做词频统计,至多几百兆内存就足 ...


做数值计算

论坛徽章:
0
20 [报告]
发表于 2012-02-24 16:12 |只看该作者
什么样的数值计算?summary也是数值计算,来一份累加一份就行了,512K内存对所有人都够了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP