Google于2017年3月在旧金山举行的Google Cloud Next会议上确认将收购数据科学竞赛平台Kaggle。这一讯息显示了数据挖掘和机器学习已经在商业领域产生了极大的价值并将带来更多纵深行业领域的应用。从一些数据中,我们也可以窥见一斑。Kaggle是2010年由Goldbloom和Ben Hamner联合创立的,现在平台上大约有100万名数据科学家,是举办数据科学和数据挖掘、机器学习竞赛的网站。目前在Kaggle上奖金最高的比赛是《Data Science Bowl 2017》,总奖金额100万美元。今年的主题是如何通过大数据和人工智能的方式,可以更早的对美国肺癌患者进行确诊以及展开干预。
在国内,CDA数据分析师举办的校园竞赛和行业峰会也在逐渐成为数据分析行业的标杆,带来越来越大的影响力。《最强大脑》里面表现亮眼的人工智能机器人“小度”显示了机器学习的强大,滴滴研究院举办Di-Tech算法大赛、天池平台与阿里云安全联合举办阿里云安全算法挑战赛,寻找数据挖掘、机器学习人才。
那么问题来了:如何加入这场商业浪潮,成为改变世界数据挖掘工程师?
CDA建模分析师课程,针对商业领域的数据挖掘课题,学习机器学习算法,带你由浅入深,扎实掌握机器学习所需知识。成为业内稀缺人才,只需三步!
第一步:入门数据挖掘,零基础也可以!
如果你想入门数据挖掘领域,那么基础的统计学知识和适当的编程基础是比不可少的。统计学部分你需要掌握统计分布、描述性统计、抽样估计、假设检验等知识。编程方面,如果之前没有接触过,你可以选择Python或者R其中一门作为入门,这两种都是很好入门的编程软件。当然,如果你实在对编程不感兴趣,只是专注于商业领域的数据挖掘应用,你可以选择SPSS Modeler和WEKA工具来进行学习。
万事开头难,有人引路便不难!这个阶段将帮你迈开数据科学职业生涯坚实的第一步!
第二步:学习数据挖掘,迈出成为建模分析师第二步
在这一阶段中,除掌握基本数据处理及分析方法以外,还应掌握高级数据分析及数据挖掘方法,如多元线性回归法,生存分析法,神经网络,决策树,判别分析法,主成分分析法,因子分析法,典型相关分析,聚类分析法,关联规则,支持向量机,时间序列,bagging,boosting等和可视化技术。
CDA优秀的课程讲师和助教将和你一起,为你带来这门充满活力的深度学习课程。课程提供实战项目和专家代码实操演练,同时在课后你可以通过老师布置的作业进行复习和巩固知识,每周视频录播进行复习观看。
第三步:进阶数据挖掘,成为稀缺人才,加入顶尖团队!
在这一阶段,你将会接触到大型的数据挖掘项目,如银行业银行业信用评分卡建置全流程、零售业大数据分析案例、电信行业离网用户预警监测案例、大型电商数据情感分析与神经网络。
这些项目将教你如何成为一名数据挖掘工程师,并将预测模型应用于银行、零售、电信、电商等领域内的大数据处理。
掌握了必要的知识,一起蓄势待发?现在,与我们一起,用挑战成就卓越!
CDA建模分析师,Python,R,SAS,SPSS Modeler。四大专题,皆为大牛!
一、课程安排
SPSS Modeler专题(上海):2017年5月03日-5月12日-连续班
Python专题(北京&远程):2017年7月01日-7月16日-周末班
R语言专题(北京&远程):2017年6月10日-6月25日-周末班
授课安排:
(1) 授课方式:周末培训,视频赠送,中文多媒体互动式授课方式
(2) 授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)
(3) 学习期限:现场与视频结合,长期学习加练习答疑。
二、课程大纲(Python专题为例)
第一阶段:数据挖掘与Python入门
1.数据分析前沿建模分析思路
2.建模分析软件对比
3.Python语法基础
4.Python的运算符与表达式
5.Python的函数与模块
6.Python的异常处理与文件操作
7.Python科学计算
8.Python绘图篇
9.Python连接数据库-Mysql篇
第二阶段:数据挖掘模型与组合算法
1.数据挖掘模型介绍与模型分类
2.数据挖掘标准流程CRSIP-DM
3.数据准备、预处理与数据转化
3.特征变量选择:主成分和因子分析
4.样本聚类
5.决策树模型
6.模型验证+组合算法
a.案例:汽车类型聚类与地域购买偏好分析
b.案例:电信离网用户预警
第三阶段:KNN与线性回归
1.最近邻域法(KNN)、MBR、样条曲线
2.线性回归与岭回归
3.可实现的Lasso算法
4.线性回归做客户价值预测
5.最近领域法与贝叶斯网络
6.关联规则与购物篮分析
a.案例:婚恋网站被约会可能性预测
b.案例:零售业客户价值预测模型
第四阶段:逻辑回归与SVM
1.逻辑回归;广义线性模型
2.支持向量机
a.案例:新闻内容分类
b.案例:银行贷款问题
c.案例:金融数据分析建模
第五阶段:文本分析与社会网络分析
1.文本分析流程概述
2.常用字符串函数与正则表达式
3.分词与词频统计
4.社会网络分析
a.案例:电信客户交友圈与流失预警
b.案例:电信再入网客户身份指纹识别
第六阶段:综合案例分析
1.电信离网用户预测案例
2.银行信用风险建模分析
3.系统聚类:基于网站定位数据的商圈分析
4.情感分析:基于电商产品数据的情感分析
5.金融数据分析:基于因子库的数据建立
6.Python网络爬虫简介
三、报名流程
1.在线填写报名信息(扫描二维码报名)
官网端:
(SPSS Modeler专题)
(Python专题)
(R专题)
微信端:
2.给予反馈,确认报名信息
3.网上缴费
4.开课前一周发送电子版课件和教室路线图
三、联系我们
电话:010-68411404
手机:13001066694(张老师)QQ:2881989710
18811331062(田老师)QQ:2881989709
邮箱:zm@cda.cn
tyx@cda.cn
—— Join Learn!