免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2486 | 回复: 0
打印 上一主题 下一主题

BI的入门 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-03-14 13:28 |只看该作者 |倒序浏览
-
       最近想学习BI,因为自己做的一个项目用到了大量Oracle 分析函数,而烃使用使用OLAP技术,系统目前数据量少,速度相对来说可以。每天数据量这么大,谁能保证积累了两年的数据后,运算速度还有这么快呢。这让我不得不思考我在做的项目与BI的差别,BI这概念之前只听说过没深入了解更没有用过相应的工具。一开始自己就想到开源的BI工具,就开始下载,找入门文档。两天之后让我发现这行不通,连概念都不理解,仅有工具是不行的。我们需要理解它的定义、历史、作用,才能开始学习它,才需要用过工具。

1、BI的定议:
      BI(Business Intelligence) 是一种运用了数据仓库、在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策支持。
     从定义上我们要明白BI运行的基础是 :数据仓库,和联机分析 ,数据挖掘
     目的:提供决策支持
2、BI分类
     信息类 BI 应用  
        指由原始数据加工而来的数据查询、报表图表、多维分析、数据可视化等应用,这些
应用的共同特点是:将数据转换为决策者可接受的信息,展现给决策者。例如将银行交易数据加工为银行财务报表。
     知识类 BI 应用

      指通过数据挖掘技术和工具,将数据中隐含的关系发掘出来,利用计算机直接将数据加工为知识,展现给决策者。
3、BI的应用模式
     A、初级模式
           数据查询和生成报表,这是BI的初级应用模式
     B、
          1、BI 高级应用模式
           OLAP ,即联机分析处理,是 BI 带来的一种全新的数据观察方式,是 BI 的核心技术 之一。
         2、数据挖掘
             数据挖掘的目的是通过计算机对大量数据进行分析,找出数据之间潜藏的规律和知识,并以可理解的方式展现给用户。数据挖掘是最高级的 BI 应用,因为它能代替部分人脑功能。   
         数据挖掘的三大要素是:

         技术和算法:目前常用的数据挖掘技术包括——
                自动类别侦测(Auto Cluster Detection)
                决策树(Decision Trees)
                神经网络(Neural Networks)

        数据:由于数据挖掘是一个在已知中挖掘未知的过程,
                因此需要大量数据的积累作为数据源,数据积累
                量越大,数据挖掘工具就会有更多的参考点。

        预测模型:也就是将需要进行数据挖掘的业务逻辑由
                计算机模拟出来,这也是数据挖掘的主要任务。


4、 底座——数据仓库技术
         数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。以上是数据仓库的官方定义。


5、总结:
      要想学好BI,以上知识点是基础。必须把基础学习才能深切的理解BI,理解客户在这主面真正意义上的需求。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP