数据仓库应用的近期发展趋势(原创且有大量专业词汇)
数据仓库近期随着高度信息化发展,以及客户更迫切的需求,有着如下流行趋势,但也伴随着相应的实施难题。1. 行业模型使用得越来越多。自己研发模型,优点是省钱、灵活、切合公司现状。然后现在越来越多客户需要的BI是既需要长远建设框架,又需要尽快见到BI的价值,以便不断累积经验产出更多价值,而不是一直在IT层面的研发。那么行业模型的三大优势,成就了这些可能:上线快、关注面全、包含了业界同行经典经验。至于灵活性的考虑,需要在实施的时候,在DW的架构上下功夫,让模型有衍生扩展空间。价格问题就需要在投入和产出中去平衡了,对于大中型优质企业来说,这点风险还是能承担的,关键是实施人员和业务人员是否能产出更多。
2. 元数据不仅仅停留在为管理而管理、简单查询这种初级阶段。在03年中国电信行业开始尝试元数据的建设时候,也不过使用初级阶段,对整个系统影响很小。当前趋势当然不能这样表面功夫,而是解决各种关于元数据的跟踪、解析和展示(业务元数据的展现),全面解决数据流的困惑。从技术角度来看,目前厂商的产品已经可以实现,但在实施上,就看能做到什么程度,能多大程度满足用户以及实施维护者自己的需求。
当前元数据的目标仍然是两个方面,一是满足IT人员的维护方便,也就是几年前就开始,不过当前已经注重图形化解析,让IT人员快速发现技术元数据的路径,同时满足多方产品元数据的import和export,而非早期元数据管理还需太多人工操作和干预。
另一方面就是针对最终用户的业务元数据应用。简单地可以用前端工具加个指标注释这样的简单功能,如果想功能强大,就需要专业产品,在前端展现工具上安装相关插件,不但可以显示其指标的解释和公式,还能自动显示相关联的指标等更多智能东西。
3. 主数据,这在前2年也仅仅停留在初级阶段,也就是用户定义好主数据后,然后集中在主数据库里统一管理。说到主数据,可能已经超出数据仓库的范畴,因为当前主数据的趋势,不仅仅是统一集中管理,还要和多业务系统交互、甚至SOA,达到真正的信息及时、统一、一致性。
4. 元数据仓库和指标库的建设。如果元数据不建立专门的库管理起来,也就是散兵游勇,对于长期建设来看,会有很大的隐患。所以当前的趋势是将元数据统一在一个库管理起来,成为所谓的元数据仓库,使元数据真正从源到展现的结果这一条大段数据线都能串联起来。
指标库的建设,目的同样是为了方便管理和维护。不同部门和分公司的用户也许对于指标有重复定义或者相关性,那么有了指标库,再结合业务元数据,可以更快给业务用户产出BI分析的数据准备,同时也能有效管理不同指标的相关性,以及方便产出更多衍生指标和扩展指标来满足行业的快速发展的分析需求。
5. 还有就是数据层级越来越分明。以前我谈到过的所谓多层级架构,现在不愿多谈所谓的理论。现在随便和一个同行交流,只要是稍微大型点的应用,都会数据层级很分明,他们的数据层级名称不一定符合ODS-EDW-DM这样的传统模式,因为名称已经不重要了,重要的是你对数据层级的理解,他们的各自的功能职责。原先只所以很多DW项目不敢分太多层级,其中一个重要原因是不方便管理。现在不同,元数据管理的实施完善,再多层次也能管理起来,不会过多投资设备和人力。
当然有一个前提,那就是循序渐进地建设,先规划好,知道未来层次怎么扩展,而早期的任务仍然是快速满足用户的BI需求,层次也就不一定十分分明,但不要紧,我们可以后期不断扩展,而不是推翻重建。
前些时候去参加一个针对甲方公司的产品介绍会,一家集成商也展示了他们的大致层次划分,很明显是对各层的功能有明确定义的,独立的数据组件,说明在各个项目中被广泛采用。 在其他专业论坛已经贴过了。
不了解数据仓库或初学者慎入。:em25: 虽然是几年前的东东,但和现在的实际开发和部署也差不了多少。
页:
[1]