innovate511 发表于 2008-09-13 23:19

数据仓库(DW),商业智能(BI)与数据挖掘(DM)

感觉CU初入门或对这些很不了解的朋友还是很多,有必要简单介绍下其核心关联和区别。

严格地来说,DW/BI/DM在一个企业的应用中是融在一起,甚至一个大项目中进行的。但从系统的角度来说,就有微妙的关系了,不过要了解其本质,无论你怎么分,那也不会范晕。

数据仓库从系统角度来看,就是数据库为核心的后台系统,绝大多数项目中,它是BI/DM应用的基础数据平台,同时也是数据管理平台,于是有的企业将其功能扩大化,加入了新的技术理念,于是称之为数据中心。一般从业务角度来看,企业的数据中心不但为BI服务,还有企业数据质量管理、主数据管理、数据交互平台等多功能。

BI从广泛的角度来看,往往包含了后台数据仓库系统,以及高级BI应用DM。而我们将DW和DM单独谈论之后,我们常说的狭义BI就仅仅是统一定义和统一平台的报表平台和多维分析平台了。

DM从广义角度来看,报表分析出来的粗略结果,OLAP分析出来的结果,也可以成为数据挖掘。不过狭义的DM当然是通过专业工具用某种算法来演算出一个结论来。不过目前多数应用在算法理论阶段,其实喜欢这个方向的朋友大可多研究算法在实际分析的应用,而非理论算法,这样才是目前企业最急需的东西。从DW的角度来看,会在数据集市为DM准备好数据,往往是数百个维和度量一起提供给DM去演算,才能得出可能符合需求的结果。

WFCJZ 发表于 2008-09-14 08:38

谢楼主,对这方面真得需要,但不了解!

ly5066113 发表于 2008-09-14 10:14

现在能真正意义上做 数据挖掘(DM) 的应该是极少数吧,绝大部分 数据仓库(DW) 都还在建设中。
我觉得DM应该换成另一个概念 数据集市(Data Mart),因为这个应用的还是比较多的。

innovate511 发表于 2008-09-14 19:06

原帖由 ly5066113 于 2008-9-14 10:14 发表 http://bbs.chinaunix.net/images/common/back.gif
现在能真正意义上做 数据挖掘(DM) 的应该是极少数吧,绝大部分 数据仓库(DW) 都还在建设中。
我觉得DM应该换成另一个概念 数据集市(Data Mart),因为这个应用的还是比较多的。
数据集市没谁会拿来专门做一个独立的系统,都是DW的一部份,只是不同的架构版本将DM和DW的关系和作用定义不同而已。数据集市必定是相对独立的数据集,独立搞的话,离企业级DW/BI的要求相差太大。只不过有的企业短期内是某些业务部门内部自己在做数据集市,但这种状态毕竟是过渡的短暂阶段。

ly5066113 发表于 2008-09-15 11:36

原帖由 innovate511 于 2008-9-14 19:06 发表 http://bbs2.chinaunix.net/images/common/back.gif

数据集市没谁会拿来专门做一个独立的系统,都是DW的一部份,只是不同的架构版本将DM和DW的关系和作用定义不同而已。数据集市必定是相对独立的数据集,独立搞的话,离企业级DW/BI的要求相差太大。只不过有的企 ...

2. Kimball派,所谓至底向上(Bottom up),也就是先针对主题应用,建设维度模型的数据仓库,而多个多维模型应用用总线逻辑架构形成数据仓库架构。这样做能最快满足客户的BI需求,但缺点是架构不容易建设稳固。

这种一般就是以建集市为主的,多个集市拼起来,有些人也称之为仓库。
DW,DM无非一个是企业级,一个是部门级。有些企业DW也是从DM建设开始的,当作视点,然后在推广。

innovate511 发表于 2008-09-15 18:35

原帖由 ly5066113 于 2008-9-15 11:36 发表 http://bbs.chinaunix.net/images/common/back.gif


2. Kimball派,所谓至底向上(Bottom up),也就是先针对主题应用,建设维度模型的数据仓库,而多个多维模型应用用总线逻辑架构形成数据仓库架构。这样做能最快满足客户的BI需求,但缺点是架构不容易建设稳 ...
Kimball在书中好象并没说明多个数据集市如何具体实现BUS Matrix Architecture,而实际项目中会以多维数据仓库为DM服务,虚拟DW很难在物理上控制DM之间的一致性和数据管理。所以实际应用中,往往更多地是先建DM,然后反推回多维数据仓库,既而为多个DM服务,然后企业再发展可能建设EDW。

所以光讨论DM,好象没啥意义,没架构思想。:em06:

betty07190409 发表于 2008-11-17 10:26

各位技术高手,有没有对数据库售前职位感兴趣的啊

各位技术高手,有没有对数据库售前职位感兴趣的啊

penknife 发表于 2008-11-20 13:34

是不是 可以片面的 把一个业务系统当做一个数据集市?

innovate511 发表于 2008-11-20 22:22

业务系统本身不能作为数据集市,OLTP系统的物理设计和OLAP的物理设计优化点有所不同,况且数据集市主流思想OLAP是多维模型思想。

从业务的角度看,一种业务系统本身是说明一个业务问题,而数据集市是反映一个大的分析主题,所以有时候业务上,业务系统的业务体并不完全等于 数据集市业务体。

mgl01xm 发表于 2008-11-21 22:54

不错!很详细
http://www.benfen.com
你可以用在线备份软件给你的数据备份
它不仅能好的解决你所提到的问题,加之它本身所具有的本地和异地都可备份的功能更会让您安全简单的进行各种数据,数据库及系统的备份。
免费下载----
PC V2.0:
http://www.crsky.com/soft/13698.html
服务器 V2.0
http://www.crsky.com/soft/13699.html
同时您也会免费得到两个版本的破解版
页: [1] 2
查看完整版本: 数据仓库(DW),商业智能(BI)与数据挖掘(DM)