Chinaunix

标题: BI的入门 [打印本页]

作者: cu_Cbear    时间: 2011-03-14 13:28
标题: BI的入门
-
       最近想学习BI,因为自己做的一个项目用到了大量Oracle 分析函数,而烃使用使用OLAP技术,系统目前数据量少,速度相对来说可以。每天数据量这么大,谁能保证积累了两年的数据后,运算速度还有这么快呢。这让我不得不思考我在做的项目与BI的差别,BI这概念之前只听说过没深入了解更没有用过相应的工具。一开始自己就想到开源的BI工具,就开始下载,找入门文档。两天之后让我发现这行不通,连概念都不理解,仅有工具是不行的。我们需要理解它的定义、历史、作用,才能开始学习它,才需要用过工具。

1、BI的定议:
      BI(Business Intelligence) 是一种运用了数据仓库、在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策支持。
     从定义上我们要明白BI运行的基础是 :数据仓库,和联机分析 ,数据挖掘
     目的:提供决策支持
2、BI分类
     信息类 BI 应用  
        指由原始数据加工而来的数据查询、报表图表、多维分析、数据可视化等应用,这些
应用的共同特点是:将数据转换为决策者可接受的信息,展现给决策者。例如将银行交易数据加工为银行财务报表。
     知识类 BI 应用

      指通过数据挖掘技术和工具,将数据中隐含的关系发掘出来,利用计算机直接将数据加工为知识,展现给决策者。
3、BI的应用模式
     A、初级模式
           数据查询和生成报表,这是BI的初级应用模式
     B、
          1、BI 高级应用模式
           OLAP ,即联机分析处理,是 BI 带来的一种全新的数据观察方式,是 BI 的核心技术 之一。
         2、数据挖掘
             数据挖掘的目的是通过计算机对大量数据进行分析,找出数据之间潜藏的规律和知识,并以可理解的方式展现给用户。数据挖掘是最高级的 BI 应用,因为它能代替部分人脑功能。   
         数据挖掘的三大要素是:

         技术和算法:目前常用的数据挖掘技术包括——
                自动类别侦测(Auto Cluster Detection)
                决策树(Decision Trees)
                神经网络(Neural Networks)

        数据:由于数据挖掘是一个在已知中挖掘未知的过程,
                因此需要大量数据的积累作为数据源,数据积累
                量越大,数据挖掘工具就会有更多的参考点。

        预测模型:也就是将需要进行数据挖掘的业务逻辑由
                计算机模拟出来,这也是数据挖掘的主要任务。


4、 底座——数据仓库技术
         数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。以上是数据仓库的官方定义。


5、总结:
      要想学好BI,以上知识点是基础。必须把基础学习才能深切的理解BI,理解客户在这主面真正意义上的需求。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2