楼主: 资料狂人
4984 75

[学科前沿] 【R培训】30小时集中学习R数据挖掘与机器学习   [推广有奖]

VIP管理员

泰斗

62%

还不是VIP/贵宾

-

威望
9
论坛币
986678650 个
学术水平
4415 点
热心指数
3226 点
信用等级
3482 点
经验
557519 点
帖子
7397
精华
143
在线时间
12406 小时
注册时间
2010-3-18
最后登录
2018-9-25

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

资料狂人 在职认证  发表于 2018-5-29 09:03:07 |显示全部楼层

能够用来做统计分析的软件和程序很多,目前应用比较广泛的包括:SPSS, SAS、R语言,MATLAB等。

R拥有非常突出的优势:

1)产品线齐全。有些R的包,比如基因分析常用的Bioconductor在在线基因数据库连接等众多功能上甚至已经远远超出商业软件。

2)免费。R的一切功能均是免费。

3)开放。由于R本身是一个统计语言环境,再新的统计模型也很快能实现,所以在结构方程模型、项目反应理论、认知诊断等众多心理测量所使用的功能上,没有现成的统计软件包,使用R则完全可以自己编写算法。同样,由于R是完全开源,我们可以很快地基于研究者已经开发出的算法编写更适合自己情况的算法。

接下来是R 开源,所以更新很快,新的理论很快就可以用上,数据处理尤其方便,data frame list啥的。R的出现解决了许多非IT人需要面对大量编程的困扰,如果我们排序难道要从bubble算法开始吗?所以一开始被人们说R是MATLAB的精简版 ,但是都用过之后才知道R更轻便好学, 而且开源啊,免费。 没那么多跟Linux 还是windows的兼容问题, R调用C可以极大提高loop的速度,Monte Carlo的时候简直就是天使!总之,如果你是要做有自己想法的,也就是需要自己编程的,强推R 。


北京7月29-8月2日厦门大学方匡南老师30小时集中现场授课

带你掌握 大数据时代数据分析的必备技能

——R数据挖掘与机器学习

时间

初级:2018年7月29-31日(三天)北京, 8月6-8日(三天)上海

高级:2018年7月31-8月2日(三天)北京, 8月8-10日(三天)上海

全程:2018年7月29-8月2日 (五天)北京, 8月6-10日(五天)上海

地点北京市海淀区厂洼街3号丹龙大厦附近/上海市南京东路培训教室

费用

初级:3300元 / 2800元 (仅限全日制本科生及硕士研究生优惠价)

高级:3600元 / 3100元 (仅限全日制本科生和硕士研究生优惠价)

全程:6000元 / 5400元 (仅限全日制本科生和硕士研究生优惠价)

(食宿自理)

安排上午9:00-12:00;下午2:00-5:00;答疑

初级班报名

高级班报名

全程班报名


讲师介绍:

方匡南现为厦门大学经济学院统计系教授、博士生导师、耶鲁大学博士后,厦门大学数据挖掘研究中心副主任,国际统计学会会士,两岸关系和平发展协同创新中心研究员、全国工业统计学会理事、厦门统计学会常务理事。

主要研究方向为数据挖掘、机器学习、应用统计、大数据风险管理及健康医疗大数据。

曾先后发表论文70多篇,其中在 JMVA、Nature子刊 Scientific Reports、CSDA、Annals of Operation Research、BiometricalJournal等国际权威期刊发表30多篇,在《管理科学学报》、《经济研究》、《统计研究》、《数量经济技术经济研究》等国内权威期刊发表40多篇。先后主持了国家自然科学基金面上项目、青年项目、国家社科基金重大项目子课题、国家统计局重大项目等学术纵向课题10多项。

有较丰富的数据挖掘实践经验,先后承担了华为、南方电网、华星光电、建行等30多项企业和政府数据挖掘项目,项目内容涉及互联网金融的大数据征信、智能制造中的数据挖掘、舆情分析与文本挖掘、深度学习与图像处理、景气指数预测预警等。


课程配套资料:
(1)提供一份精心准备的非常全面的R软件入门和数据挖掘与机器学习讲义。
(2)提供课程源代码1份和相应数据若干份。
特别赠送:方老师主讲的R初级和高级视频,价值1000元!

学员对象:

金融、医疗、通讯、咨询、电子商务等领域的数据分析人员、数据挖掘工程师、数据科学家;

高校硕士生、博士生、青年教师等。


培训目的和特色:

1. 让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。
2. 以实际案例引入,深入浅出地讲解如何使用R语言进行数据挖掘和机器学习,让学员不仅掌握R语言的使用,更重要的是学会数据挖掘和机器学习的思想、原理和方法。
3. 学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。


培训内容目录
(第1-6讲为初级班,第5-10讲为高级班;中间重叠一天):

第1讲(3小时)R语言入门

目标:掌握R语言的基本用法

1.R语言介绍

2.编辑软件Rstudio使用

3.R程序包的载入与使用

4.数据对象及运算(向量、矩阵、数组、列表与数据框处理)


第2讲(3小时)数据读写,R基本编程

目标:掌握用R编写函数和数据的读写

1.R数据读入与读出(读入txt、xls、SPSS、SAS、stata以及数据库文件)

2.R函数编写

3.R的条件与循环函数

4.高效编程技巧介绍


第3讲(3小时)数据预处理,探索性分析

目标:掌握数据预处理与探索性分析

1.数据预处理

2.缺失值处理

3.随机数生成

4.常用统计方法的蒙特卡洛模拟

5.随机抽样

6.单变量数据分析与作图

7.双变量数据分析与作图

8.多变量数据分析与作图

案例1:统计作图在调查数据中的应用

案例2:统计作图在临床医学中的应用


第4讲(3小时)数据挖掘与机器学习入门,线性回归

目标:数据挖掘与机器学习入门

1.何为数据挖掘与机器学习

2.数据挖掘与机器学习的主要研究内容

3.有监督学习与无监督学习区别

4.一元线性回归

5.多元线性回归

6.逐步回归

案例1:广告营销计划案例

案例2:信用卡债务预测案例

案例3:房价预测案例


第5讲(3小时)线性分类方法

目标:掌握经典线性分类方法及其应用

1.Logistic模型

2.LDA判别分类

3.QDA判别分类

案例1:信用卡违约预测案例

案例2:股价涨跌方向预测案例


第6讲(3小时)重抽样方法

目标:掌握经典重抽样方法

1.验证集方法

2.交叉验证

3.Bootstrap方法

案例1:量化投资资产配置案例

案例2:汽车每加仑汽油里程数预测案例


第7讲(3小时)决策树,组合预测

目标:掌握决策树和组合预测方法及其实际应用。

1.CART决策树

2.Bagging

3.随机森林   

4.Boosting算法

案例1:棒球运动员薪水预测案例

案例2:心脏病预测案例

案例3:信用卡违约预测案例


第8讲(3小时)支持向量机

目标:掌握支持向量机分类方法

1.间隔分类器

2.支持向量分类器

3.支持向量机

案例1:基因表达数据案例

案例2:股票涨跌方向预测


第9讲(3小时)变量选择与高维数

目标:掌握数据挖掘中高维数据分析方法及其实际应用

1.LASSO

2.SCAD

3.MCP

4.Group LASSO

案例1:基因筛选

案例2:股票选股


第10讲(3小时)无监督学习,主成分分析,主成分回归,聚类分析  

目标:掌握无监督学习方法及其应用。

1.主成分分析

2.主成分回归

3.Kmeans聚类分析

4.系统聚类分析

案例1:广告支出主成分分析

案例2:犯罪率主成分分析

案例3:学生考试成绩主成分分析

案例4:客户细分聚类案例

往期京沪现场班:

合图.jpg


优惠:

现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;

以上优惠不叠加。


报名流程:
1:点击“初级班/高级班/全程班报名”,网上填写信息提交;
2:给予反馈,确认报名信息;
3:网上订单缴费(需要刷卡或对公转账的请报名后与我们联系);
4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南。

联系方式:

魏老师
QQ:28819897142881989714
Mail:vip@pinggu.org
Tel: 010-68478566






stata SPSS
资料狂人 在职认证  发表于 2018-5-29 09:03:08 |显示全部楼层
R初高级开课通知-邀请函_北京.pdf (399.09 KB)
R初高级开课通知-邀请函_上海.pdf (398.17 KB)




回复

使用道具 举报

资料狂人 在职认证  发表于 2018-5-29 09:03:09 |显示全部楼层
7月北京, 8月上海暑期班全面开启报名:
北京                        
SSCI/SCI论文写作发表实战        7.19-21        陈世智        http://bbs.pinggu.org/thread-6270393-1-1.html
DSGE模型原理及应用                7.20-23        朱传奇        http://bbs.pinggu.org/thread-4745835-1-1.html
Stata初级班                              7.23-25        连玉君        http://bbs.pinggu.org/thread-5034156-1-1.html
Stata高级班                              7.27-29        连玉君        http://bbs.pinggu.org/thread-5034156-1-1.html
Stata论文班                              7.31-8.2       连玉君        http://bbs.pinggu.org/thread-5034156-1-1.html
MATLAB空间计量经济学           8.3-5            于瀚辰        http://bbs.pinggu.org/thread-5944976-1-1.html

上海                        
SSCI/SCI论文写作发表实战        8.2-4        陈世智        http://bbs.pinggu.org/thread-6270393-1-1.html
DSGE模型原理及应用                8.7-10      朱传奇        http://bbs.pinggu.org/thread-4745835-1-1.html






回复

使用道具 举报

资料狂人 在职认证  发表于 2018-5-29 09:03:10 |显示全部楼层
方老师做了大量的统计和数据挖掘的应用推广工作,每年坚持开5-6次全国公开课和众多企业的技术内训,讲授《R机器学习》、《R数据挖掘》、《R数据分析》等课程,培训对象为国内外高校青年教师、研究生、业界数据挖掘工程师,每年培训500名左右技术人员。此外,为厦门大学、华南理工大学等MBA/EDP授课,推广在企事业单位实施数据化运营和管理的理念,每年为企业高管和ZF官员培训4000人左右。
回复

使用道具 举报

wmwong 发表于 2018-5-29 09:06:22 |显示全部楼层

回帖奖励 +3

support!
回复

使用道具 举报

fengyg 企业认证  发表于 2018-5-29 09:18:36 |显示全部楼层

回帖奖励 +3

kankan
回复

使用道具 举报

karst 发表于 2018-5-29 09:38:55 |显示全部楼层

回帖奖励 +3

回复

使用道具 举报

sunwaiter 发表于 2018-5-29 09:51:54 |显示全部楼层

回帖奖励 +3

回复

使用道具 举报

土八路 发表于 2018-5-29 09:57:51 |显示全部楼层

回帖奖励 +3

支持支持
回复

使用道具 举报

yeting2000 发表于 2018-5-29 09:58:52 |显示全部楼层

回帖奖励 +3

谢谢楼主分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-9-25 14:03