请选择 进入手机版 | 继续访问电脑版
楼主: Still..
5900 10

[数据挖掘] 数据分析与挖掘的联系和区别! [推广有奖]

学术权威

52%

还不是VIP/贵宾

-

威望
5
论坛币
79420 个
通用积分
26693.7016
学术水平
603 点
热心指数
378 点
信用等级
577 点
经验
166749 点
帖子
1914
精华
56
在线时间
2362 小时
注册时间
2011-8-30
最后登录
2024-2-27

Still.. 企业认证  发表于 2013-10-9 16:50:28 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据挖掘挖什么?

        前一篇我总结了一些软件的区别和选择。在数据分析的学习道路上,放正了心态(心术篇),扎实了基础(理论篇),熟练了工具(软件篇)后,无论是学术研究还是业务应用,基本可以独立地进行数据分析的工作了,而更多技能的提升需要在数据分析这个平台里不断的进行实战研究,不断提升对业务的敏锐分析,不断的精通对软件的创新演练。
      然而,有了这些还不够,数据分析只是在已定的假设,先验约束上处理原有计算方法,统计方法,将数据分析转化为信息,而这些信息需要进一步的获得认知,转化为有效的预测和决策,这时就需要数据挖掘,也就是我们数据分析师系统成长之路的“更上一楼”。

      数据挖掘与数据分析两者紧密相连,具有循环递归的关系,数据分析结果需要进一步进行数据挖掘才能指导决策,而数据挖掘进行价值评估的过程也需要调整先验约束而再次进行数据分析。
      而两者的具体区别在于:
(其实数据分析的范围广,包含了数据挖掘,在这里区别主要是指统计分析)


  • 数据量上:数据分析的数据量可能并不大,而数据挖掘的数据量极大。
  • 约束上:数据分析是从一个假设出发,需要自行建立方程或模型来与假设吻合,而数据挖掘不需要假设,可以自动建立方程。
  • 对象上:数据分析往往是针对数字化的数据,而数据挖掘能够采用不同类型的数据,比如声音,文本等。
  • 结果上:数据分析对结果进行解释,呈现出有效信息,数据挖掘的结果不容易解释,对信息进行价值评估,着眼于预测未来,并提出决策性建议。
数据分析是把数据变成信息的工具,数据挖掘是把信息变成认知的工具,如果我们想要从数据中提取一定的规律(即认知)往往需要数据分析和数据挖掘结合使用。

举个例子说明:你揣着50元去菜市场买菜,对于琳琅满目的鸡鸭鱼猪肉以及各类蔬菜,想荤素搭配,你逐一询问价格,不断进行统计分析,能各自买到多少肉,多少菜,大概能吃多久,心里得出一组信息,这就是数据分析。而关系到你做出选择的时候就需要对这些信息进行价值评估,根据自己的偏好,营养价值,科学的搭配,用餐时间计划,最有性价比的组合等等,对这些信息进行价值化分析,最终确定一个购买方案,这就是数据挖掘。
数据分析与数据挖掘的结合最终才能落地,将数据的有用性发挥到极致。

    关于数据挖掘,涉及的主要方法主要有:数据分析的方法、可视技术、关联法则、神经网络、决策树、遗传算法等。

    主要使用的工具有:R语言,SASwekaSPSS Modeler(Clementine)等,可参考几款开源的软件:http://www.iteye.com/news/4693


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析与挖掘 数据分析 SPSS Modeler clementine clementin 计算方法 创新 技能 软件 统计 数据分析专题 数据处理 数据分析软件 数据分析报告 面板数据分析 excel数据分析 数据分析方法 项目数据分析

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
seth_lee + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

加入数据科学交流圈,获取最新行业资讯、研究报告、免费学习资源!咨询微信:CDAdata01
taizhoucaoyang 在职认证  发表于 2013-10-9 16:51:51 |显示全部楼层 |坛友微信交流群
看看
数学建模伤不起

使用道具

水生宅 发表于 2013-11-29 10:50:10 |显示全部楼层 |坛友微信交流群
谢谢楼主普及知识,作为菜鸟选手有了一定感官认识

使用道具

水生宅 发表于 2013-11-29 10:53:51 |显示全部楼层 |坛友微信交流群
昨天和专门研究大数据的在读硕士同学讨论了大数据,有了一定的认识。大数据是量变引起质变,数据量增大之后整个数据组织结构和算法结构全部发生变化。其核心是数据的流结构,数据存储在分布式云数据库上,所有数据操纵采用并行算法,现有的统计分析算法基础很难应对如此庞大的数据量。

使用道具

Still.. 企业认证  发表于 2013-11-29 11:31:14 |显示全部楼层 |坛友微信交流群
水生宅 发表于 2013-11-29 10:53
昨天和专门研究大数据的在读硕士同学讨论了大数据,有了一定的认识。大数据是量变引起质变,数据量增大之后 ...
恩恩, 不过国内能做大数据的没有几个
加入数据科学交流圈,获取最新行业资讯、研究报告、免费学习资源!咨询微信:CDAdata01

使用道具

水生宅 发表于 2013-11-29 11:56:32 |显示全部楼层 |坛友微信交流群
Still.. 发表于 2013-11-29 11:31
恩恩, 不过国内能做大数据的没有几个
现在云存储比较成熟了,这么大的数据要做并行运算在算法和工具上都不成熟,哪个能开发出来大数据挖掘算法就可以领先未来数据市场了

使用道具

niliu_happy 发表于 2013-12-7 15:47:21 |显示全部楼层 |坛友微信交流群
学习了

使用道具

scabcpk 发表于 2014-1-25 17:59:07 |显示全部楼层 |坛友微信交流群
这两个概念估计很容易混淆
never give up!

使用道具

数据挖掘,我的下一个学习目标!

使用道具

猫丢了 发表于 2014-5-26 14:33:34 |显示全部楼层 |坛友微信交流群
学习了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 00:35