免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2419 | 回复: 0
打印 上一主题 下一主题

推荐几个数据挖掘的软件: 数据挖掘,Data Mining [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-02-17 00:06 |只看该作者 |倒序浏览
   
数据挖掘(Data Mining)
,就是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。
   
   正如信息爆炸规律所揭示的,海量的数据正在产生,需要我们建造超大的数据中心进行管理,更需要我们采用有效的数据分析手段来解释数据本身所隐含的规律。

以下是信息爆炸规律的具体表述:
   英国科学家詹姆斯.马丁认为:   
       人类的科学知识在19世纪70年代是每50年增加一倍, 20世纪中叶是每10年增加一倍, 在20世纪70年代就已经缩短到每5年增加一倍; 同时,信息分散,交叉引用频繁,人类信息的生产能力超过了人类对信息的处理、组织和吸收能力,从而产生了信息爆炸的危机。

哈哈,下面,我推荐几个开源的数据挖掘软件,兴许你用的着哦!

1 weka         
               
http://www.cs.waikato.ac.nz/ml/weka/
2 Yale         
               
http://rapid-i.com/
3 KNIME        
               
http://www.knime.org/index.html
4 R (统计软件)
               
http://www.r-project.org/
5 Rattle(R基础上的GUI)
               
http://rattle.togaware.com/
5 AlphaMiner(哈工大基于weka内核开发)
               
http://bi.hitsz.edu.cn/AlphaMiner/index.htm
6 在Excel中实现了决策树、神经网络等算法。可惜VBA工程被作者加密了,不能看到源码; 不过在此基础上进行VSTO,或许蛮省时吧,我还没做过。   
               
http://www.geocities.com/adotsaha/
7 Apache Lucene  
               
http://lucene.apache.org/

Apache Lucene  是一个开放源程序的搜寻器引擎,利用它可以轻易地为Java软件加入全文搜寻功能。 Lucene的最主要工作是替文件的每一个字作索引,通过索引,让搜寻的效率比传统的逐字有了很大的提高;Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,最重要的是使使用者可以依据自已的需要自定制其功能。



本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u3/105477/showart_2182121.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP