免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 15308 | 回复: 37
打印 上一主题 下一主题

[BI] 大家在实施数据挖掘的项目,你们都使用什么工具呢(获奖名单已公布2013-3-14) [复制链接]

论坛徽章:
4
CU大牛徽章
日期:2013-03-13 15:29:07CU大牛徽章
日期:2013-03-13 15:29:49CU大牛徽章
日期:2013-03-13 15:30:192015年迎新春徽章
日期:2015-03-04 09:57:09
1 [报告]
发表于 2013-01-15 11:38 |只看该作者
还没接触过数据挖掘……

论坛徽章:
6
CU大牛徽章
日期:2013-04-17 10:59:39CU大牛徽章
日期:2013-04-17 11:01:45CU大牛徽章
日期:2013-04-17 11:02:15CU大牛徽章
日期:2013-04-17 11:02:36CU大牛徽章
日期:2013-04-17 11:02:582015年辞旧岁徽章
日期:2015-03-03 16:54:15
2 [报告]
发表于 2013-01-15 13:14 |只看该作者
map reduce吧
社交网站没做过

论坛徽章:
0
3 [报告]
发表于 2013-01-15 15:05 |只看该作者
数据挖掘还是需要很多经验的人来进行的,而且要对业务非常的熟悉,不然的话挖掘的都是表面的东西
没看到过成功的数据挖掘。。。

论坛徽章:
223
2022北京冬奥会纪念版徽章
日期:2015-08-10 16:30:32操作系统版块每日发帖之星
日期:2016-05-10 19:22:58操作系统版块每日发帖之星
日期:2016-02-18 06:20:00操作系统版块每日发帖之星
日期:2016-03-01 06:20:00操作系统版块每日发帖之星
日期:2016-03-02 06:20:0015-16赛季CBA联赛之上海
日期:2019-09-20 12:29:3219周年集字徽章-周
日期:2019-10-01 20:47:4815-16赛季CBA联赛之八一
日期:2020-10-23 18:30:5320周年集字徽章-20	
日期:2020-10-28 14:14:2615-16赛季CBA联赛之广夏
日期:2023-02-25 16:26:26CU十四周年纪念徽章
日期:2023-04-13 12:23:10操作系统版块每日发帖之星
日期:2016-05-10 19:22:58
4 [报告]
发表于 2013-01-15 15:17 |只看该作者
没见过什么数据挖掘,感觉很多都在吹牛

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
5 [报告]
发表于 2013-01-15 15:39 |只看该作者
不知道什么叫数据挖掘,

论坛徽章:
4
CU十二周年纪念徽章
日期:2013-10-24 15:41:34摩羯座
日期:2013-12-24 13:05:332015亚冠之西悉尼流浪者
日期:2015-10-09 16:03:47fulanqi
日期:2016-06-17 17:54:25
6 [报告]
发表于 2013-01-15 15:40 |只看该作者
1.大家在实施数据挖掘的项目,你们都使用什么工具呢?
答:使用过的专业工具有:SPSS、SAS

2.讨论一下数据挖掘在web2.0的应用。
答:数据挖掘目前的应用主要是:分类、聚类、关联规则,这几个方面。对于web2.0的应用来说,主要是通过对用户行为数据的挖掘来进行精准营销,比如:准确的广告投放,以及相关的商品推荐等~

3.大家是如何进行数据挖掘呢?有没有什么好的方法?
答:大家知道,数据挖掘(DM)是商务智能BI应用的一个最高层次,也是最有价值的层次,但也是最难把握的一个层次。大家看好数据挖掘,无非是希望发现一些隐藏的事实、关联的规则,希望对未来运营、生产的管理决策更精准。但,现实是,目前还很难做到这一点,因为DM科学本身在发展是一方面,另一方面是数据的不准确性导致DM的水平也打了很多折扣。个人认为要做好DM,还是要先做好DW(数据仓库),其次是深刻理解业务,要从业务数据中能挖出多少“金子”,关键还在于对业务的理解深刻度。

论坛徽章:
6
CU大牛徽章
日期:2013-05-20 10:43:41IT运维版块每日发帖之星
日期:2016-07-29 06:20:00IT运维版块每日发帖之星
日期:2016-01-27 06:20:00CU大牛徽章
日期:2013-05-20 10:44:16CU大牛徽章
日期:2013-05-20 10:44:0615-16赛季CBA联赛之广东
日期:2018-03-09 11:17:08
7 [报告]
发表于 2013-01-15 18:38 |只看该作者
刚接触DM,正在啃书ing。。。
1.大家在实施数据挖掘的项目,你们都使用什么工具呢?
答:接触过SPSS和R语言,hadoop(mahout),比较流行
2.讨论一下数据挖掘在web2.0的应用。
答:就目前我所知道的,DM在商品推荐,好友推荐,日志分析,用户行为分析有比较多的应用。比如amazon.cn的商品推荐,新浪微博的好友推荐,日志分析这一块,前段时间就看过一篇利用hadoop分析网站访问日志的文章,我记得刚开始学hadoop的时候,一说到应用就是fb的日志分析。用户行为分析的话,不知道算不算日志分析这一块,163邮箱有个分析用户使用邮箱的情况的分析功能,每隔一段时间就能收到来自163邮箱的邮件,上面统计了我登录邮箱的情况,发了多少封邮件出去,收到多少邮件等等项目,最后给出一个建议什么的,如,多和朋友联系之类的。用户行为分析在商业中应该比较常见,正如前面一位所说的,准确的广告投放什么的。科研方面,数据挖掘有比较重要的地位,e.g.气象分析,天文信息处理等。
3.大家是如何进行数据挖掘呢?有没有什么好的方法?
答:目前还没真正进行过数据挖掘,不过我觉得DM是一个发展中的领域,或是几个领域的结合体,对于从事数据挖掘工作的人来说,应该具备相关行业的行业背景,扎实的数学基础(主要是统计之类)以及编程能力(能写程序,像R语言,java神马的,hadoop就是用java写的)。如何从海量数据中挖掘出对自己感兴趣的模式,需要有大数据处理的能力,我觉得这也是今后发展的趋势。所以能使用MapReduce之类的工具是非常有帮助的。

刚开始学习DM的知识,就算是对前段时间学习情况的总结吧 !! O(∩_∩)O~  

论坛徽章:
1
巨蟹座
日期:2014-04-23 23:20:17
8 [报告]
发表于 2013-01-15 23:42 |只看该作者
看过数据挖掘概念与技术,感觉就是自己做数学建模时候的一些东西,毫无新意。个人不赞成学计算机的人搞这个,还有算法分析之类,这些都应该由数学专业的同仁来做。不喜勿喷

论坛徽章:
8
巨蟹座
日期:2013-08-12 09:41:40IT运维版块每日发帖之星
日期:2015-12-09 06:20:00寅虎
日期:2013-12-25 14:59:40天秤座
日期:2013-12-06 14:04:55酉鸡
日期:2013-11-28 10:22:22水瓶座
日期:2013-08-26 15:40:54巨蟹座
日期:2013-08-12 09:42:01每日论坛发贴之星
日期:2015-12-09 06:20:00
9 [报告]
发表于 2013-01-16 10:39 |只看该作者
恩。有道理,学数学的转计算机啊也比较快。而且研究数据也比较快回复 9# registcn


   

论坛徽章:
1
巨蟹座
日期:2014-04-23 23:20:17
10 [报告]
发表于 2013-01-16 11:41 |只看该作者
是啊,本来计算机学科越来越庞大,越来越臃肿,俨然有成为真正的基础学科之势。比如,我们要学逻辑学,要学电路,要学数学,但是哪一个拿出来,都是一个独立的专业,要想让计算机的人搞明白某个方向,那他们在本科、硕士期间,岂不是其他方向浪费了很多无谓的精力和时间?回复 10# arron刘


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP