楼主: 资料狂人
2169 69

[学科前沿] “R数据挖掘与机器学习”7月北京集中短训现场班   [推广有奖]

VIP管理员

泰斗

62%

还不是VIP/贵宾

-

威望
9
论坛币
986678716 个
学术水平
4415 点
热心指数
3226 点
信用等级
3482 点
经验
557470 点
帖子
7393
精华
143
在线时间
12394 小时
注册时间
2010-3-18
最后登录
2018-9-20

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

资料狂人 在职认证  发表于 2018-6-29 08:53:39 |显示全部楼层

R是一套完整的数据处理、计算和制图软件系统。

其功能包括:

1.  数据存储和处理系统;

2.  数组运算工具(其向量、矩阵运算方面功能尤其强大);

3.  完整连贯的统计分析工具;

4.  优秀的统计制图功能;

5.  简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。


与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。

R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法


7月29-8月2日“R数据挖掘与机器学习”集中短训现场班

通过案例掌握R初高级_每讲均配有案例帮助迅速掌握应用

讲师介绍:

方匡南现为厦门大学经济学院统计系教授、博士生导师、耶鲁大学博士后,厦门大学数据挖掘研究中心副主任,国际统计学会会士,两岸关系和平发展协同创新中心研究员、全国工业统计学会理事、厦门统计学会常务理事。

主要究方向为数据挖掘、机器学习、应用统计、大数据风险管理及健康医疗大数据。

曾先后发表论文70多篇,其中在 JMVA、Nature子刊 Scientific Reports、CSDA、Annals of Operation Research、Biometrical Journal等国际权威期刊发表30多篇,在《管理科学学报》、《经济研究》、《统计研究》、《数量经济技术经济研究》等国内权威期刊发表40多篇。先后主持了国家自然科学基金面上项目、青年项目、国家社科基金重大项目子课题、国家统计局重大项目等学术纵向课题10多项。

有较丰富的数据挖掘实践经验,先后承担了华为、南方电网、华星光电、建行等30多项企业和政府数据挖掘项目,项目内容涉及互联网金融的大数据征信、智能制造中的数据挖掘、舆情分析与文本挖掘、深度学习与图像处理、景气指数预测预警等。


学员对象:

金融、医疗、通讯、咨询、电子商务等领域的数据分析人员、数据挖掘工程师、数据科学家;

高校硕士生、博士生、青年教师等。


开课信息:

时间:

初级:2018年7月29-31日(三天)

高级:2018年7月31-8月2日(三天)

全程:2018年7月29-8月2日 (五天)

地点:北京市海淀区厂洼街3号丹龙大厦附近

费用:

初级:3300元/ 2800元(本科及硕士在读优惠价)

高级:3600元/ 3100元(本科及硕士在读优惠价)

全程:6000元/ 5400元(本科及硕士在读优惠价)

(食宿自理)

安排:上午9:00-12:00;下午2:00-5:00;答疑


培训目的和特色:

1. 让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。
2. 以实际案例引入,深入浅出地讲解如何使用R语言进行数据挖掘和机器学习,让学员不仅掌握R语言的使用,更重要的是学会数据挖掘和机器学习的思想、原理和方法。
3. 学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。


培训内容目录:

【初级班】

专题名称

授课内容

第1讲(3小时)

R语言入门


目标:掌握R语言的基本用法

1.R语言介绍

2.编辑软件Rstudio使用

3.R程序包的载入与使用

4.数据对象及运算(向量、矩阵、数组、列表与数据框处理)


2(3小时)

数据读写

R基本编程


目标:掌握用R编写函数和数据的读写

1. R数据读入与读出

    (读入txt、xls、SPSS、SAS、stata以及数据库文件)

2.R 函数编写

3.R的条件与循环函数

4.高效编程技巧介绍


3(3小时)

数据预处理

探索性分析


目标:掌握数据预处理与探索性分析

1.数据预处理

2.缺失值处理

3.随机数生成

4.常用统计方法的蒙特卡洛模拟

5.随机抽样

6.单变量数据分析与作图

7.双变量数据分析与作图

8.多变量数据分析与作图

案例1:统计作图在调查数据中的应用

案例2:统计作图在临床医学中的应用


43小时)

数据挖掘与机器学习入门

线性回归


目标:数据挖掘与机器学习入门

1.何为数据挖掘与机器学习

2.数据挖掘与机器学习的主要研究内容

3.有监督学习与无监督学习区别

4.一元线性回归

5.多元线性回归

6.逐步回归

案例1:广告营销计划案例

案例2:信用卡债务预测案例

案例3:房价预测案例


5(3小时)

线性分类方法


目标:掌握经典线性分类方法及其应用

1.Logistic模型

2.LDA判别分类

3.QDA判别分类

案例1:信用卡违约预测案例

案例2:股价涨跌方向预测案例

第6讲(3小时)

重抽样方法

互动交流讨论


目标:掌握经典重抽样方法

1.验证集方法

2.交叉验证

3.Bootstrap方法

案例1:量化投资资产配置案例

案例2:汽车每加仑汽油里程数预测案例

互动交流讨论


【高级班】

专题名称

授课内容


1

线性分类方法


目标:掌握经典线性分类方法及其应用

1.Logistic模型

2.LDA判别分类

3.QDA判别分类

案例1:信用卡违约预测案例

案例2:股价涨跌方向预测案例


2(3小时)

重抽样方法


目标:掌握经典重抽样方法

1.验证集方法

2.交叉验证

3.Bootstrap方法

案例1:量化投资资产配置案例

案例2:汽车每加仑汽油里程数预测案例


3(3小时)

决策树

组合预测


课程目标:掌握决策树和组合预测方法及其实际应用。

1.CART决策树

2.Bagging

3.随机森林   

4.Boosting算法

案例1:棒球运动员薪水预测案例

案例2:心脏病预测案例

案例3:信用卡违约预测案例


4(3小时)

支持向量机


课程目标:掌握支持向量机分类方法

1.间隔分类器

2.支持向量分类器

3.支持向量机

案例1:基因表达数据案例

案例2:股票涨跌方向预测


5(3小时)

变量选择与高维数据


目标:掌握数据挖掘中高维数据分析方法及其实际应用

1.LASSO

2.SCAD

3.MCP

4.Group  LASSO

案例1:基因筛选

案例2: 股票选股

6(3小时)

无监督学习

主成分分析

主成分回归

聚类分析

目标:掌握无监督学习方法及其应用。

1.主成分分析

2.主成分回归

3.Kmeans聚类分析

4.系统聚类分析

案例1:广告支出主成分分析

案例2:犯罪率主成分分析

案例3:学生考试成绩主成分分析

案例4:客户细分聚类案例


往期京沪现场班:


优惠:

现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;

以上优惠不叠加。


报名流程:
1:点击“初级班/高级班/全程班报名”,网上填写信息提交;
2:给予反馈,确认报名信息;
3:网上订单缴费(需要刷卡或对公转账的请报名后与我们联系);
4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南。

联系方式:
魏老师
QQ:28819897142881989714
Mail:vip@pinggu.org
Tel:010-68478566





stata SPSS
资料狂人 在职认证  发表于 2018-6-29 08:53:40 |显示全部楼层
北京暑期学术班:               
SSCI/SCI论文写作发表实战        7.19-21        陈世智        http://bbs.pinggu.org/thread-6270393-1-1.html
DSGE模型原理及应用                7.20-23        朱传奇        http://bbs.pinggu.org/thread-4745835-1-1.html
Stata初级班                              7.23-25        连玉君        http://bbs.pinggu.org/thread-5034156-1-1.html
Stata高级班                              7.27-29        连玉君        http://bbs.pinggu.org/thread-5034156-1-1.html
Stata论文班                              7.31-8.2       连玉君        http://bbs.pinggu.org/thread-5034156-1-1.html
MATLAB空间计量经济学           8.3-5            于瀚辰        http://bbs.pinggu.org/thread-5944976-1-1.html




回复

使用道具 举报

weinamaleny 在职认证  发表于 2018-6-29 08:55:54 |显示全部楼层

回帖奖励 +3

方老师每年寒暑假开班
-想学习R语言
-看过方老师的书觉得还不够
-后续工作或者学习对R语言有需求
-不知道怎么处理目前的R相关的项目
……
都适合参加学习,等你来
回复

使用道具 举报

资料狂人 在职认证  发表于 2018-6-29 08:57:46 |显示全部楼层
R语言由新西兰奥克兰大学Ross和Robert开发。

R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目前R软件有3000多种贡献包,几乎可以实现所有的统计方法,目前大部分的统计学家和计量经济学家都使用R语言,而且越来越多的数据分析实务人员也开始使用R语言。

R语言具有简单易学,功能强大,体积小(仅40m左右),完全免费,可自由开发等特点,且R语言和S语言语法基本相同,绝大部分程序是互相兼容的。学习R软件正成为一种趋势。
R软件优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。——Google首席经济学家Hal Varian
回复

使用道具 举报

阿扁V5 学生认证  发表于 2018-6-29 08:58:36 |显示全部楼层

回帖奖励 +3

回复

使用道具 举报

资料狂人 在职认证  发表于 2018-6-29 09:07:51 |显示全部楼层
如果你平时的工作会涉及到统计学,那么接触R语言实在是太正常不过了。因为R语言本身为统计而生,所以你能想到的所有统计相关的工作,R都可以非常简洁的用几行命令(甚至1行命令)帮你完成。
       在R官网有这样几句介绍:“R provides a wide variety of statistical (linear and nonlinear modelling, classical statistical tests, time-series analysis, classification, clustering, …) and graphical techniques, and is highly extensible.  One of R's strengths is the ease with which well-designed publication-quality plots can be produced, including mathematical symbols and formulae where needed.”
        * R高度的可扩展性正是体现在它那1万多个包上,你想做的几乎所有事情都可以用现有的R包来辅助完成(当然,有些工作即便能完成但也不适合)。
        * R另一个杀手锏就是其强大的绘图功能,正如上面的英文介绍所言,R可以画图,画各种各样的图,画各种各样高逼格的图,画各种各样高逼格可以直接出版的图。
       * 完善的统计学功能再加上强大的绘图功能,就是你学习的理由。
回复

使用道具 举报

tututu 发表于 2018-6-29 09:31:13 |显示全部楼层

回帖奖励 +3

支持一下
回复

使用道具 举报

幸运符 发表于 2018-6-29 09:41:39 |显示全部楼层

回帖奖励 +3

回复

使用道具 举报

cszcszcsz 发表于 2018-6-29 10:17:14 |显示全部楼层

回帖奖励 +3

回复

使用道具 举报

961938985 发表于 2018-6-29 10:25:08 |显示全部楼层

回帖奖励 +3

支持一下
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-9-21 07:08