楼主: 资料狂人
2803 58

[学科前沿] 机器学习及R应用寒假现场班_2020年北京R培训 [分享]

VIP管理员

泰斗

69%

还不是VIP/贵宾

-

威望
9
论坛币
986597863 个
通用积分
25971.8229
学术水平
4496 点
热心指数
3270 点
信用等级
3509 点
经验
562328 点
帖子
7666
精华
142
在线时间
13692 小时
注册时间
2010-3-18
最后登录
2019-10-21

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

资料狂人 在职认证  发表于 2019-7-15 09:54:34 |显示全部楼层

Why R?

√ R是统计学家发明的专门用于统计计算的语言

R是统计学家的母语

R中的统计“包”(package)最多,且增长迅速

统计学顶级期刊的新发表论文一般带有相应的R包

R是免费开源的,在学界与业界均有很多用户

1月11-15日机器学习及R应用集中短训现场班

授课方式:思想原理 + 数学精髓 + R经典案例


讲师介绍:

本课程由山东大学经济学院陈强教授亲授。陈强教授获得北京大学经济学学士、硕士,美国Northern Illinois University数学硕士、经济学博士,现为数量经济学博士生导师,在统计学、计量经济学及机器学习领域具有深厚的功底,2010年入选教育部新世纪优秀人才支持计划。陈强老师著有畅销研究生教材《高级计量经济学及Stata应用》(第2版,高教社,2014),并特别擅长深入浅出、直指人心地介绍数据分析原理,深受广大学生们的喜爱,其现场班常常人满为患、好评如潮。


开课信息:

时间:2020年1月11-15日(五天)

地点:北京市海淀区厂洼街3号丹龙大厦附近

费用:5000元/ 4400元(本科及硕士在读优惠价);食宿自理

安排:上午9:00-12:00;下午2:00-5:00;答疑


培训目的和特色:

机器学习早期为人工智能的分支,后来也有不少统计学家加入,最近一、二十年因为其预测精度迅速提高而走红,并在业界有着广泛的应用。可以预见,在未来三十年,几乎所有行业都会因机器学习的深刻冲击而改变。MIT名誉校长Eric Grimson曾预言,机器学习会成为像Word一样的工具。而谁先掌握此工具,则可占得先机,成为时代的弄潮儿(至少不会落伍)。


基于机器学习的通用性,本次“机器学习及R应用”五天现场班将面向所有行业与学科的人士、老师与学生(包含经管社科、医学卫生等领域)。


本课程的最大特色在于“一站式服务”,从机器学习的原理、数学推导,到R语言命令与经典案例,无不精心设计、丝丝入扣,理论联系实操,让学员们迅速理解机器学习的精髓,并掌握最为流行的数据科学软件R语言操作。


培训内容目录:

1机器学习引论

(1) 什么是机器学习

(2) 机器学习的分类与术语

(3) 案例:垃圾邮件过滤;手写体数字识别;图像识别;自动驾驶


2  R语言快速入门

(1) Why R?

(2) 安装R与RStudio

(3) R的对象(vector, matrix, data frame,list)

(4) 面向对象的函数式语言

(5) R语言画图


3惩罚回归

(1) OLS

(2) RidgeRegression

(3) Lasso

(4) ElasticNet

(5) 交叉验证 (Cross-validation)

(6) PostDouble Lasso and IV Lasso

(7) R案例


4线性分类

(1) Logit

(2) 多项Logit

(3) 贝叶斯决策理论

(4) 线性判别分析

(5) 二次判别分析

(6) ROC/AUC

(7) R案例


5朴素贝叶斯

(1) 朴素贝叶斯

(2) 拉普拉斯修正

(3) R案例


6 K近邻法

(1) KNN forRegression

(2) KNN forClassification

(3) 偏差与方差的权衡

(4) 维度灾难

(5) R案例


7决策树

(1) 分类树

(2) 分裂准则(错分率、基尼指数、信息熵)

(3) 修枝与交叉验证

(4) 回归树

(5) R案例


8装袋法与随机森林

(1) 集成学习(Ensemble Learning)

(2) 装袋法(Bagging)

(3) 随机森林(Random Forest)

(4) 变量重要性(Variable Importance)

(5) 偏依赖图(Partial Dependence Plot)

(6) R案例


9提升法

(1) 自适应提升法 (AdaBoost)

(2) AdaBoost的统计解释

(3) 梯度提升法 (Gradient Boosting Machine)

(4) R案例


10支持向量机

(1) MaximalMargin Classifier

(2) SoftMargin

(3) SupportVector Machine

(4) KernelTrick

(5) R案例


11前馈神经网络

(1) 前馈神经网络

(2) 反向传播算法(Back-propagation Algorithm)

(3) 随机梯度下降(Stochastic Gradient Descent)

(4) 神经网络的过拟合

(5) 深度学习的发展

(6) R案例


12卷积神经网络

(1) 计算机视觉

(2) 卷积运算(Convolution Operation)

(3) 卷积神经网络(卷积层、汇聚层)

(4) R案例


13循环神经网络

(1) 文本数据与词嵌套(WordingEmbedding)

(2) 循环神经网络(RecurrentNeural Network)

(3) 长短期记忆模型(LSTM)

(4) 门控循环单元(GRU)

(5) R案例


14主成分分析

(1) 总体中的主成分分析

(2) 样本中的主成分分析

(3) 方差分解与降维

(4) 主成分回归

(5) R案例


15聚类分析

(1) K-均值聚类(K-meansClustering)

(2) 分层聚类(Hierarchical Clustering)

(3) 树状图

(4) R案例


16机器学习在经管社科的应用

精读几篇在经管社科顶刊发表的经典机器学习论文


不难看出,本次课程可谓干货满满、奇货可居。

更难得可贵的是,主讲老师陈强教授具有丰富的教学经验、激情与魅力,是广大计量学子心目中真正的“计量男神”,尤其擅长化繁为简、直指人心,让学员们迅速上手新知识与技能。


跟着陈强老师,五天入门机器学习,登堂入室,立竿见影,赶上时代的步伐!


优惠:

现场班老学员9折优惠;

同一单位三人以上同时报名9折优惠;

同一单位六人以上同时报名8折优惠;

以上优惠不叠加。


报名流程:

1:点击“http://www.peixun.net/main.php?mod=buy&cid=1436”,网上填写信息提交;

2:给予反馈,确认报名信息;

3:网上订单缴费(需要刷卡或对公转账的请报名后与我们联系);

4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南。


联系方式:

魏老师

QQ:28819897142881989714

Mail:vip@pinggu.org

Tel:010-68478566


已有 1 人评分学术水平 收起 理由
zhdefei + 2 精彩帖子

总评分: 学术水平 + 2   查看全部评分




stata SPSS
资料狂人 在职认证  发表于 2019-7-15 09:57:09 |显示全部楼层
机器学习与R应用课纲202001.png



回复

使用道具 举报

资料狂人 在职认证  发表于 2019-7-15 10:01:01 |显示全部楼层
R语言由新西兰奥克兰大学Ross和Robert开发。

R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目前R软件有3000多种贡献包,几乎可以实现所有的统计方法,目前大部分的统计学家和计量经济学家都使用R语言,而且越来越多的数据分析实务人员也开始使用R语言。

R语言具有简单易学,功能强大,体积小(仅40m左右),完全免费,可自由开发等特点,且R语言和S语言语法基本相同,绝大部分程序是互相兼容的。学习R软件正成为一种趋势。
R软件优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。——Google首席经济学家Hal Varian



回复

使用道具 举报

资料狂人 在职认证  发表于 2019-7-15 10:02:09 |显示全部楼层
R是一套完整的数据处理、计算和制图软件系统。

其功能包括:

1.  数据存储和处理系统;

2.  数组运算工具(其向量、矩阵运算方面功能尤其强大);

3.  完整连贯的统计分析工具;

4.  优秀的统计制图功能;

5.  简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能
回复

使用道具 举报

资料狂人 在职认证  发表于 2019-7-15 10:02:20 |显示全部楼层
与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。

R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。
回复

使用道具 举报

资料狂人 在职认证  发表于 2019-7-15 10:08:02 |显示全部楼层
欢迎咨询,报名参加~
回复

使用道具 举报

chengganglee 发表于 2019-7-15 11:54:45 |显示全部楼层

回帖奖励 +2

支持一下了
回复

使用道具 举报

rossrachel 发表于 2019-7-15 12:23:36 |显示全部楼层

回帖奖励 +2

支持一下!
回复

使用道具 举报

gx666666gx888 发表于 2019-7-15 12:44:02 |显示全部楼层

回帖奖励 +2

学习了。
回复

使用道具 举报

karst 发表于 2019-7-15 12:52:43 |显示全部楼层

回帖奖励 +2

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-10-21 11:06