楼主: davil2000
3125 10

[数据挖掘理论与案例] 泛论数据挖掘 [推广有奖]

院士

99%

还不是VIP/贵宾

-

TA的文库  其他...

☆大数据时代文库☆

威望
4
论坛币
29699 个
通用积分
13.5900
学术水平
1172 点
热心指数
1121 点
信用等级
1143 点
经验
97406 点
帖子
2730
精华
19
在线时间
3003 小时
注册时间
2004-10-31
最后登录
2022-6-10

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

    数据挖掘(Data Mining),无非就是从“海量”数据中获取有效信息过程。这可以形象比喻为“挖掘”的过程。传统的数据挖掘方法包括了因子分析、回归分析、聚类分析、列联表分析、典型相关分析等等;新颖的方法则包括了决策树(CARTCHAIDC5.0)或模糊计算等方法。这些方法虽然可以归属于数理统计学的领域,但只能作为衍生的“产品”。

数据挖掘有相当大的比重是由艰深的统计理论所支撑的。然而,相对于纯粹的数理统计而言,数据挖掘则能够引发业界的关注。这是因为,数据挖掘有下列几项特性

  1.简易的操作性。处理大量实际数据更强势,无须专业的统计学背景就可以使用数据挖掘的工具;

  2.有效的针对性。数据挖掘理论与方法的设计、开发与应用目的本身就是为了方便企业终端用户使用的目的;

  3.广泛的适用性。从企业数据库中获取海量数据,并使用专用硬件及软件来进行信息分析,从而数据挖掘的理念紧密跟上了互联网时代的步伐。

  如果将Data Warehousing(数据仓库)理解为矿井,则数据挖掘就是采矿任务。数据挖掘并非点金术,没有够丰富完整的数据来源,很难指望能够挖掘出什么有意义的信息出来。要将海量数据有效转换成为信息,必须先收集信息。互联网时代的科技进步使得数据库系统就成了最好的数据存储工具。数据仓库是一个经过整合的关系型数据库,用以储存决策支持系统(Design Support System, DSS)的数据,目的还是为了数据分析或者决策支持。数据仓库本身所含数据是精确、完备,并且是经过整合的。数据仓库应先行建立完成,数据挖掘才能有效率的进行。

  数据挖掘步骤包括:1. 理解业务;2. 获取数据;3. 整合数据;4. 筛选数据;5. 抽样试验;6. 建立数模;7.  模型分析;8. 测试检验;9. 经验解释;10. 预测决策。

  数据挖掘牵涉了大量的准备工作与规划过程,事实上在数据挖掘进程中大部分的时间精力是花费在数据预处理的阶段,其中包含数据的净化与格式化甚至表格连结。由此可知数据挖掘只是信息挖掘过程中的一个步骤而已,在进行此步骤前还有许多的工作要先完成。

数据挖掘近年来成为相当热门的话题,实际上却非新生事物。所使用的预测模型、数据分割、连结分析、偏差侦测等,美国早在二次世界大战前就已应用运用在人口普查及军事等方面。现代计算技术的发展,例如关系型数据库、模糊计算理论、基因算法则以及类神经网络等,使得从数据中发掘宝藏成为一种系统的、可实行的程序。

  数据挖掘的理论技术可分为传统与改良两支。传统技术以统计分析为代表,统计学内所含序列统计、概率论、回归分析、类别数据分析等都属于传统数据挖掘技术,尤其数据挖掘 对象多为变量繁多且样本数庞大的数据,是以数理统计学的因子分析(Factor Analysis)、判别分析(Discriminant Analysis),以及聚类分析(Cluster Analysis)等,在数据挖掘过程中特别常用。在改良技术方面,应用较普遍的有决策树、类神经网络以及规则归纳法等。决策树是一种用树枝状展现数据受各变量的影响情形之预测模型,根据对目标变量产生之效应的不同而建构分类的规则,一般多运用在对客户数据的分析上,例如针对有回函与未回含的邮寄对象找出影响其分类结果的变量组合。常用的决策树算法包括CARTCHAID以及C5.0算法。

  从应用角度来看,数据挖掘的功能包括:Classification(分类)和Clustering(聚类);Regression(回归)和Forecasting(预测);Association(截面关联)和Sequence(时序关联)。数据挖掘在各领域的应用非常广泛,只要该产业拥有具分析价值与需求的数据仓储或数据库,皆可利用Mining工具进行有目的的挖掘分析。一般较常见的应用案例多发生在零售业、直效行销界、制造业、财务金融保险、通讯业以及医疗服务等。

  市场上的数据挖掘工具大致可分为三类

1. 通用性软件包:SAS Enterprise MinerIBM Intelligent MinerUnica PRWIBM SPSS Modeler.SGI MineSetOracle Darwin等。

2. 专用性软件包:KD1(零售)、Options & Choices(保险)、HNC(信用卡诈欺或呆帐侦测)、Unica Model 1(营销)

3. 整合DSSDecision Support Systems/OLAP/数据挖掘的大型分析系统。


欲知晓了解更多:https://bbs.pinggu.org/thread-1409460-1-1.html

学会数据挖掘,成就黄金人生!!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 SPSS Modeler discriminant Forecasting Intelligent 数据 挖掘 统计 算法

已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
数据分析师3K + 100 + 5 + 5 + 5 精彩帖子

总评分: 经验 + 100  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

R是万能的,SAS是不可战胜的!
沙发
jiao_taishan 发表于 2012-4-12 20:50:04 |只看作者 |坛友微信交流群
文章怕是有点儿老了,看后面的软件分类就知道至少是2年前的
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
davil2000 + 1 + 1 + 1 观点有启发

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

常用统计数据来源:中国统计月报,中国经济景气月报

使用道具

藤椅
aibieli731001 发表于 2012-4-12 20:56:28 |只看作者 |坛友微信交流群
这个分析的不错,谢谢分享。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
davil2000 + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

板凳
davil2000 发表于 2012-4-12 21:12:16 |只看作者 |坛友微信交流群
jiao_taishan 发表于 2012-4-12 20:50
文章怕是有点儿老了,看后面的软件分类就知道至少是2年前的
愿闻详细!
R是万能的,SAS是不可战胜的!

使用道具

报纸
jiao_taishan 发表于 2012-4-12 22:24:02 |只看作者 |坛友微信交流群
davil2000 发表于 2012-4-12 21:12
愿闻详细!
比如SPSS已经被IBM收购了呀~而且SPSS也改名了
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
davil2000 + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

常用统计数据来源:中国统计月报,中国经济景气月报

使用道具

地板
kuangsir6 发表于 2012-4-13 13:45:37 |只看作者 |坛友微信交流群
分析的很好,资料有点旧。
SPSS Clementine 早已改名为IBM SPSS Modeler.
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
davil2000 + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

7
davil2000 发表于 2012-4-13 14:04:39 |只看作者 |坛友微信交流群
kuangsir6 发表于 2012-4-13 13:45
分析的很好,资料有点旧。
SPSS Clementine 早已改名为IBM SPSS Modeler.
感谢回复,接受你的和1楼的意见。
R是万能的,SAS是不可战胜的!

使用道具

8
kuangsir6 发表于 2012-4-13 14:08:16 |只看作者 |坛友微信交流群
davil2000 发表于 2012-4-13 14:04
感谢回复,接受你的和1楼的意见。
哈,谢谢老兄奖励。

使用道具

9
davil2000 发表于 2012-4-13 14:26:00 |只看作者 |坛友微信交流群
kuangsir6 发表于 2012-4-13 14:08
哈,谢谢老兄奖励。
O(∩_∩)O~  
学了一点皮毛,自以为有了心得。
承蒙楼上两位高手给予指导了。
R是万能的,SAS是不可战胜的!

使用道具

10
小新小颖 发表于 2012-4-15 19:44:06 |只看作者 |坛友微信交流群
这个分析的不错,谢谢分享。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-28 02:06