Chinaunix

标题: 请教一个数据库选择的问题 [打印本页]

作者: advCorydon    时间: 2010-06-11 11:33
标题: 请教一个数据库选择的问题
正在做一个产品,数据库有两个选择Oracle或者MySQL,请大家帮我出出主意,非常感谢!

我的数据流大概如下:
1.从设备采集数据,每15分钟采集一次;
2.分析数据(JAVA程序),然后存入数据库(原始数据),每个设备一条记录,大概1万个设备,每个设备有3000~5000个属性,每个属性在数据库中为1列;
3.使用存储过程从上面的原始数据中挑选出大概500~1000个属性,计算成大概200个字段的数据,存入数据库;
4.30分钟到达时,把上面200个字段的15分钟的数据汇总成30分钟的数据,存入数据库;(存储过程)
5.60分钟到达时,把15分(或者30分钟)的数据汇总成60分钟的数据,存入数据库;(存储过程)


需求:
1.数据汇总尽量快,从采集数据到最终汇成60分钟的数据要在10分钟内完成;在整点的时候有大量的数据操作(插入,删除,选取);
2.原始数据表中的数据可以保留很短时间(几个小时或者1天,或者就只保留15分钟的数据);
3.计算后的数据保留7天。 记录条数是10000 × 4 × 24 × 7 = 6720000,大概是单表1000万数据;10张表的话大概就是1亿条数据;
4.考虑以后的扩展性,还有另外一种逻辑设备,数量是这个设备的20倍左右,也就是说它的数据将单表过1亿条数据;
5.稳定性比较重要;


请教,大家在选择数据库的时候一般考虑哪些因素?
1. 价格?
2. 稳定性?
3. 其他?

从成本上考虑,应该选mysql,毕竟它便宜,由于我对数据库不是很了解,不知道mysql能不能抗得住这样的数据操作,还有稳定性。

如果选择oracle,就得给产品部门(他们控制成本)一个合理的解释,为什么要选用oracle?

谢谢大家了!
作者: bigapple2008    时间: 2010-06-11 12:30
如此要依赖存储过程的话
Oracle合适点

Mysql的存储过程,貌似出现也没多久。

不过你的这种数据设计要求,貌似蛮奇特的,你可以去关注下MYSQL的底层引擎,因为Mysql的引擎是可以替换的,说不定就有一种支持很多的column。
作者: evaspring    时间: 2010-06-11 13:17
选ORACLE啊,回扣多 ~
作者: dingning239    时间: 2010-06-14 10:08
面对这种数据采集的系统,我的一个朋友他们单位全部才用awk来做文本处理,效率很高,建议楼主不要选数据库了(如果从性能上来考虑)
作者: dream_land    时间: 2010-06-18 16:26
awk是何物?




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2