请选择 进入手机版 | 继续访问电脑版
楼主: 浮世若离丶
7893 104

[学科前沿] 一文了解数据挖掘的道法术器   [推广有奖]

  • 4关注
  • 69粉丝

教授

64%

还不是VIP/贵宾

-

威望
1
论坛币
25039 个
通用积分
88.0606
学术水平
66 点
热心指数
95 点
信用等级
50 点
经验
20248 点
帖子
669
精华
1
在线时间
1300 小时
注册时间
2015-8-6
最后登录
2021-7-28

浮世若离丶 发表于 2016-9-14 10:21:02 |显示全部楼层

+2 论坛币
k人 参与回答

经管之家邀请您加入群聊

群内不定期有福利发放!

求职就业群
来和老师们一起学习吧~

经管之家送您一门免费课程

点击免费领取~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

程序员.png

商业和生活中,我们处处能够看到数据挖掘的影子:

Target 百货分析16岁的少女买无香型沐浴露之后,判断她怀孕了;

语言学家通过记录自己孩子出生到3岁每天每秒钟的状态数据,发现语言记忆和周遭环境相关性更大;

调查局通过数据分析和挖掘发现改善公共环境有助于降低犯罪率。


今天我们将从以下几个方面来揭开数据挖掘的神秘面纱。

数据挖掘涉及的学科?

1.png

首先我们可以看出,数据分析与挖掘位于中间,也就是红点的位置,而旁边有很多交叉的学科。

数据库系统是现在比较普及的一种存储数据信息的方式,也就是电子档案的方式。统计学是一种传统的数据分析方法,它的起源比较早。模式识别、机器学习和人工智能与数据挖掘的交集点不多。机器学习,它本身是我们人类在研究人工智能的一种分析方法,提出了一些计算机的算法,而这些算法是和数据分析、数据挖掘是有交集的,比如前段时间比较火热的Alphago在人工神经网络方面的成功应用,而这些算法目前也逐渐应用在了商业范围内。

总体来说,数据分析与数据挖掘肯定是一门高度交叉的学科,而且包含的知识点,领域特别广,是综合社会科学和自然科学的一种交叉的一种学问。


数据挖掘的“道法术器”

2.png

1.道以明向:建模流程、建模技术、业务场景的理解。

道,是放在最上层的东西,不管是什么学科,什么学问。而具体在数据挖掘领域,道着眼于对于整个数据挖掘的整套基本流程和建模技术、业务三者结合的深刻了解。需要大量的经验积累形成自己的一套思路和方法。


2.法以立本:数据挖掘的标准流程化的步骤。

目前比较成熟的数据挖掘标准化流程如KDD(Knowledge Discovery inDatabase),CRISP-DM(Cross-industryStandard Process For Data Mining)。


3.术以立策:数据挖掘的具体建模方法。

描述性(无监督学习)

用处:分析具有多个属性的数据集,找出潜在的模式,没有因变量

场景:观察个体之间的相似程度,例如根据年龄、性别、收入等因素进行客户细分;根据客户对多个产品的购买,发现产品之间的相关性,做精准商品推荐。

主要算法:聚类、关联分析、因子分析、主成份分析、社交网络分析、…


预测性(有监督学习)

用处:用一个或多个自变量预测因变量的值

场景:客户是否会违约是一个因变量,可以用客户的性别、年龄、收入、职位、经济状况、历史信用状况等因素进行预测

主要算法:决策树、线性回归、Logistic回归、支持向量机、神经网络、判别分析、…


4.器以成事:建模的具体工具。

传统商业分析工具SAS,SPSS,开源类工具R,Python,Weka,Hadoop,Spark等。现在各种软件越来越智能化,越来越接近傻瓜化。但是软件的智能化不等于整个数据分析的智能化与自动化,如果没有对业务的深刻理解,建立的模型就没有说服力。关于软件的使用和选择,记住三点:

一、只要能达到目标的软件就是好软件;

二、你研究领域啥软件好用啥软件就是好软件;

三、不要妄想用一个软件解决一切问题。


介绍完数据挖掘的道法术器,对数据挖掘课程感兴趣的同学看过来!

C9DGDIP93I]{R@L2%5XUAT0.png

听说CDA2级也开设了R语言数据挖掘课程,课程将世界客户关系管理方面的领导者美库尔公司(Merkle Inc)在专业管理咨询方面的几十年的经验积累与CDA数据分析研究院的教学理念与方法相结合,归纳了在商业智能系统设计、客户画像、精准营销、生命周期价值管理等主题的课程,结合R语言进行项目实操。感兴趣的小伙伴们快来学习吧!


课程信息

北京&远程:10月15-16,22-23,29-30日(6天)

授课安排:现场班5900元,远程班4400元

(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式

(2) 授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)

(3) 学习期限:现场与视频结合,长期学习加练习答疑。


报名流程

1.在线填写报名信息

CDA官网:

(北京)

(直播)

CDA微信:

@PAIIMUW8{VK~XG%JO3J3BK.png

2.给予反馈,确认报名信息

3.网上缴费

4.开课前一周发送电子版课件和教室路线图


联系我们

电话:010-68411404

手机:18010006628(陈老师)QQ28819897092881989709

   13001066694(张老师)QQ:28819897102881989710

邮箱:cwj@cda.cn

   zm@cda.cn

—— Join Learn!



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 Data Mining Join Learn logistic回归 Discovery 数据库系统 孩子出生 统计学 调查局 相关性

已有 2 人评分经验 热心指数 收起 理由
李会超 + 40 鼓励积极发帖讨论
狂热的爱好者 + 5 精彩帖子

总评分: 经验 + 40  热心指数 + 5   查看全部评分

stata SPSS
浮世若离丶 发表于 2016-9-14 10:22:28 |显示全部楼层
授课大纲:
第一阶段 R与统计语言基础
1.R语言基础
2.数据整合
3.描述分析与统计基础

第二阶段 商业智能(BI)分析系统实现
1.探索数据分析
2.绘图包
3.BI功能实现

第三阶段 数据清洗与转换
1.缺失值处理
2.噪声值处理
3.数据变换
4.数据归约

第四阶段 客户分析与营销模型
1.客户画像
2.客户细分
3.精准营销
4.营销组合优化

第五阶段 风险预测与检测模型
1.信用风险建模
2.欺诈建模
3.客户终身价值分析

第六阶段 长尾理论与推荐系统设计
1.级联与流行
2.幂率与长尾理论
3.推荐系统设计

第七阶段 模型管理
1.模型生命周期
2.工作流设计
回复

使用道具 举报

Still.. 发表于 2016-9-14 10:30:59 |显示全部楼层

回帖奖励 +3

R语言现在在商业数据挖掘领域应用越来越广泛了,课程内容很充实,大牛常国珍老师主讲,赞!
回复

使用道具 举报

sqy 发表于 2016-9-14 10:52:27 |显示全部楼层

回帖奖励 +3

顶!!!!!!!!!!
回复

使用道具 举报

littledog.. 发表于 2016-9-14 11:24:40 |显示全部楼层

回帖奖励 +3


R语言现在在商业数据挖掘领域应用越来越广泛了,课程内容很充实,大牛常国珍老师主讲,赞!
回复

使用道具 举报

cheetahfly 在职认证  发表于 2016-9-14 13:55:30 |显示全部楼层

回帖奖励 +3

不错,很厉害。
回复

使用道具 举报

Quant0160601 发表于 2016-9-14 14:08:14 |显示全部楼层

回帖奖励 +3

决策树、线性回归、Logistic回归、支持向量机、神经网络、判别分析
回复

使用道具 举报

jgchen1966 发表于 2016-9-14 14:15:00 |显示全部楼层

回帖奖励 +3

不错!!!
回复

使用道具 举报

wuhui1018 在职认证  发表于 2016-9-14 14:40:42 |显示全部楼层

回帖奖励 +3

是不错的学习机会,就是没时间啊,当然也没钱
回复

使用道具 举报

Frank233 发表于 2016-9-14 15:05:55 |显示全部楼层

回帖奖励 +3

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2021-7-29 01:56