免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1285 | 回复: 0
打印 上一主题 下一主题

[归档与迁移] 数据挖掘,数据归档 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-07-19 23:17 |只看该作者 |倒序浏览

明确需求-信息收集-数据采样-清除转换-分析提炼-信息归档-信息发送-使用反馈。
 数据挖掘大体上有两种功能:预测 / 验证功能和描述功能。前者指用数据库的若干已知属性预测或验证其他未知属性值;后者指找到描述数据的可理解模式。具体地说,数据挖掘的任务主要包括:
  (1)数据分类(Classification):发现每一数据与既定类别间的映像函数的过程,在市场调查、信用评估等领域应用广泛,常用的方法有决策树、神经网络、遗传算法、Rough集等。
  (2)回归分析(Regression):发现变量和属性间的依赖关系。
  (3)聚类分析(Clustering):根据对象之间的相似性把对象分组。
  (4)概括(Summarization):寻找数据集合的描述。
  (5)构造依赖模式(Dependency Pattern):构造变量间函数依赖关系或相关关系的模型。
  (6)偏差分析(DeviationDetection):探测数据现状和历史记录或标准之间的差别,例如结果与期望的偏离,反常实例等。
中国多有哪些公司正在从事这样的工作?


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/73648/showart_1086708.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP