大数据量实时入库的问题

address2 发表于 2009-03-19 19:52

现在项目有个需求，需要大量数据实时入库，从数据生成到可查询不超过10s，数据量大约是50MB/s, 一天2T左右，目前测试表明sybaseIQ如果生成好文件的话，loadtable大约能入59MB/s, 问题是从前端传到数据库服务器，再格式化，然后调用loadtable，效率降低了很多，生成大文件又无法保证实时性，使用管道测试结果也不理想。
各位大侠有没有什么好办法或类似经验，讨论一下。

enjoy-work 发表于 2009-03-20 11:01

我觉得IQ load table 可以更快。有没有用并行加载？系统的cpu数目是多少？

camham 发表于 2009-03-20 17:32

别的方法load速度达不到要求，只能这样做

address2 发表于 2009-03-20 21:18

原帖由 enjoy-work 于 2009-3-20 11:01 发表 http://bbs3.chinaunix.net/images/common/back.gif
我觉得IQ load table 可以更快。有没有用并行加载？系统的cpu数目是多少？

4 CPU , 只有一张表，IQ好像不支持单表并行加载

address2 发表于 2009-03-20 21:19

原帖由 camham 于 2009-3-20 17:32 发表 http://bbs3.chinaunix.net/images/common/back.gif
别的方法load速度达不到要求，只能这样做

是不是用管道比用文件要慢?

enjoy-work 发表于 2009-03-23 09:36

原帖由 address2 于 2009-3-20 21:18 发表 http://bbs.chinaunix.net/images/common/back.gif

4 CPU , 只有一张表，IQ好像不支持单表并行加载

IQ不支持并发加载，但是load可以并发加载。能不能把你的load 语句铁出来看看，我觉得应该可以达到你要的性能的。

zq5143 发表于 2009-03-23 15:47

原帖由 address2 于 2009-3-20 21:18 发表 http://bbs3.chinaunix.net/images/common/back.gif

4 CPU , 只有一张表，IQ好像不支持单表并行加载

谁说不支持~？

zq5143 发表于 2009-03-23 15:51

楼主说的实时入库是怎么来实现？复制服务器吗？
源库的删改操作也能体现在IQ上吗？

snow888 发表于 2009-03-23 19:08

没明白楼主的意思，不过感觉 IQ 不是干这个活儿的。

chenfeng825 发表于 2009-03-24 10:09

楼主其实问题已经很明确了。iq load本身能够满足性能需求。
但格式化和网络传输限制有些限制，所以是否可以考虑用其他的主机在共享存储格式化，这样总会有很大的节省的。至于总时间窗口的缩小还是要借助于所有的方面。总之，就是找到瓶颈所在着重优化
例如对load memory的调整，使用更好的存储，网络.优化格式化程序等等方面

另外,iq似乎就是干这活的！

页: [1] 2

Chinaunix's Archiver

大数据量实时入库的问题