免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3507 | 回复: 1
打印 上一主题 下一主题

上次做了一个系统碰到的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-12-05 10:00 |只看该作者 |倒序浏览
本帖最后由 027xiatian 于 2010-12-05 13:35 编辑

从原始的apache日志分析,到入库,到各种维度的报表统计,前端日志分析阶段采用的是shell,perl,后端采用的是infobright,整个统计系统分成多层(分层目的也是为了高度复用,避免写入与业务有关的代码),
所以整个过程比较长,为了捕获每一个阶段可能出现的异常,在每一层都会向状态表插入该层处理是否成功的标示,来达到后期自动修补的目的。
目前统计系统出发点也就利用ib的高压缩比,SQL查询的高效,  带来的好处也不用说(存储的压力较小,统计报表的时效性优越),在这个基础之上的数据开发的效率也比较快,只需要填写相应的配置项,SQL语句就可以将报表统计完成,将开发人员的精力集中在业务层面,做业务层面的开发,抽出时间,精力做业务。
弊端也相当明显:
   1.ICE对复杂SQL的准确性有些bug,基本在目前的统计中,没有采用很复杂的SQL(同过系统分层来解决这个问题)
    2.数据容灾上,采取冗余备份的策略(虽然耗费磁盘,目前也没有好的方法来处理 了)
    3.现在由于表的规模已经达到几亿级别(infobright),做表的导入导出碰到一些问题,ICE不支持DML, 虽然写脚本来完成类似的insert,delete,alter的通用功能模块,但随着表规模的扩大,那么这种操作的时间开销是越来越大!!目前有没有其他的更好的方案呢?(目前正在找解决方法)

论坛徽章:
0
2 [报告]
发表于 2011-03-10 14:24 |只看该作者
结贴,已经通过其他的策略搞定!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP