免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: titansword2000
打印 上一主题 下一主题

天量数据如何处理? [复制链接]

论坛徽章:
0
31 [报告]
发表于 2012-02-24 17:47 |只看该作者
狗蛋 发表于 2012-02-24 17:25
时间不同步问题不大,反正是每个基站采样一个角度,数据上也带有时间。只要以目标识别为中心设计算法,这个 ...


数据有一定的敏感性,但没达到保密级别,不过为了省掉多余的烦恼,还是采纳兄弟的建议,谢就一个字!

论坛徽章:
0
32 [报告]
发表于 2012-02-24 18:03 |只看该作者
狗蛋 发表于 2012-02-24 17:25
时间不同步问题不大,反正是每个基站采样一个角度,数据上也带有时间。只要以目标识别为中心设计算法,这个 ...


============
1:因为时间不同步,所以在计算目标物速度时需要对两两基站的时间进行比对。
2:没有具体目标物,我在前面说描述的空间网格均是目标物,所以无法“以目标识别为中心设计算法”

论坛徽章:
0
33 [报告]
发表于 2012-02-25 08:26 |只看该作者
难道是网优的东西?  建议用hadoop

论坛徽章:
0
34 [报告]
发表于 2012-02-25 22:34 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
7
CU大牛徽章
日期:2013-03-14 14:16:29CU大牛徽章
日期:2013-03-14 14:16:32CU大牛徽章
日期:2013-03-14 14:16:34CU大牛徽章
日期:2013-03-14 14:16:35IT运维版块每日发帖之星
日期:2015-07-13 23:09:32IT运维版块每日发帖之星
日期:2015-07-13 22:20:00数据库技术版块每日发帖之星
日期:2015-09-08 06:20:00
35 [报告]
发表于 2012-02-26 14:36 |只看该作者
首先,你既然遇到了这么大量的数据需要处理,你需要一台好的机器,特别是内存要大,4G太小了,40G也小,最好是80G以上,现在的服务器很容易达到这样要求,价格不会超过10万。然后使用64位的操作系统,编程的环境当然也是64位的,排除java,你可以使用非常大的内存,连整形变量都变得出奇的大了。

论坛徽章:
4
CU大牛徽章
日期:2013-04-17 11:48:26CU大牛徽章
日期:2013-04-17 11:48:40CU大牛徽章
日期:2013-04-17 11:48:45摩羯座
日期:2013-12-06 18:10:04
36 [报告]
发表于 2012-02-26 16:06 |只看该作者
本帖最后由 fire_cpp 于 2012-02-26 16:09 编辑

你说超出2G内存限制,是不是还用32位系统啊?上64位系统,大内存——好像废话。

推荐R语言。R已经良好支持hadoop了。R是非常好的统计分析语言,和S语言师出同门。建议你可以关注一下这个东西,用它做分布式计算。
另外,你也可以考虑下商业方案——SAS。这里说的SAS是指统计分析工具,不是硬盘。它处理大数据集非常优秀,可以达到数据库的程度。但这套软件非常贵,而且只租不卖……

论坛徽章:
0
37 [报告]
发表于 2012-02-27 21:14 |只看该作者
回复 35# wangyb


    有几年前的小型机,但仍然满足不了您说的这个要求

论坛徽章:
0
38 [报告]
发表于 2012-02-27 21:15 |只看该作者
回复 36# fire_cpp


    从来没接触到这么些东西,要一会上手有些难度

论坛徽章:
1
技术图书徽章
日期:2013-09-10 08:57:55
39 [报告]
发表于 2012-02-27 22:56 |只看该作者
1. 内存容量够时, 怎么计算?
2. 只要一个基站的数据就可以了, 还是要多个基站?
3. 如果是两两结合, 那么这个组合的要求是什么? 相邻的进行组合, 还是任意组合?
4. 这里有个扫描速度的问题, 那么扫描结果不全时对计算有没有影响?

关键是: 只有部分数据(按地区或时间分), 能不能向计算目标推进, 得到中间结果.

论坛徽章:
0
40 [报告]
发表于 2012-02-28 08:02 |只看该作者
回复 39# pprpg


   
1. 内存容量够时, 怎么计算?
2. 只要一个基站的数据就可以了, 还是要多个基站?
3. 如果是两两结合, 那么这个组合的要求是什么? 相邻的进行组合, 还是任意组合?
4. 这里有个扫描速度的问题, 那么扫描结果不全时对计算有没有影响?

关键是: 只有部分数据(按地区或时间分), 能不能向计算目标推进, 得到中间结果.

=======================
1:没听明白
2:需要多个基站的数据
3:相邻的两基站组合
4:所有基站的扫描速度相同,但它们的时间不一定同步;当扫描不全时,计算区域填充缺测值
5:如只有部分基站数据,只要两基站的扫描能有交叉区域,即可计算;如只有部分时间数据,只要在某一时间窗口内有数据,即可计算。不能向计算目标推进,因为所有空间均是目标。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP