大数据量实时入库的问题
现在项目有个需求,需要大量数据实时入库,从数据生成到可查询不超过10s,数据量大约是50MB/s, 一天2T左右,目前测试表明sybaseIQ如果生成好文件的话,loadtable大约能入59MB/s, 问题是从前端传到数据库服务器,再格式化,然后调用loadtable,效率降低了很多,生成大文件又无法保证实时性,使用管道测试结果也不理想。各位大侠有没有什么好办法或类似经验,讨论一下。 我觉得IQ load table 可以更快。有没有用并行加载?系统的cpu数目是多少? 别的方法load速度达不到要求,只能这样做 原帖由 enjoy-work 于 2009-3-20 11:01 发表 http://bbs3.chinaunix.net/images/common/back.gif
我觉得IQ load table 可以更快。有没有用并行加载?系统的cpu数目是多少?
4 CPU , 只有一张表,IQ好像不支持单表并行加载 原帖由 camham 于 2009-3-20 17:32 发表 http://bbs3.chinaunix.net/images/common/back.gif
别的方法load速度达不到要求,只能这样做
是不是用管道比用文件要慢? 原帖由 address2 于 2009-3-20 21:18 发表 http://bbs.chinaunix.net/images/common/back.gif
4 CPU , 只有一张表,IQ好像不支持单表并行加载
IQ不支持并发加载,但是load可以并发加载。能不能把你的load 语句铁出来看看,我觉得应该可以达到你要的性能的。 原帖由 address2 于 2009-3-20 21:18 发表 http://bbs3.chinaunix.net/images/common/back.gif
4 CPU , 只有一张表,IQ好像不支持单表并行加载
谁说不支持~? 楼主说的实时入库是怎么来实现?复制服务器吗?
源库的删改操作也能体现在IQ上吗? 没明白楼主的意思,不过感觉 IQ 不是干这个活儿的。 楼主其实问题已经很明确了。iq load本身能够满足性能需求。
但格式化和网络传输限制有些限制,所以是否可以考虑用其他的主机在共享存储格式化,这样总会有很大的节省的。至于总时间窗口的缩小还是要借助于所有的方面。总之,就是找到瓶颈所在着重优化
例如对load memory的调整,使用更好的存储,网络.优化格式化程序等等方面
另外,iq似乎就是干这活的!
页:
[1]
2