楼主: 资料狂人
15397 85

[学科前沿] 2025年寒假Flag:掌握Python机器学习   [推广有奖]

回帖奖励 20 个论坛币 回复本帖可获得 5 个论坛币奖励! 每人限 1 次

运营管理员

巨擘

0%

还不是VIP/贵宾

-

威望
9
论坛币
973494724 个
通用积分
42008.1836
学术水平
4617 点
热心指数
3402 点
信用等级
3620 点
经验
647187 点
帖子
9793
精华
140
在线时间
18580 小时
注册时间
2010-5-4
最后登录
2024-11-5

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

2025年寒假,你的决心是什么?你有多久没有系统地更新知识了?每次别人谈起机器学习与人工智能,你若总是云里雾里,这种状况还要持续多久?


机器学习早期为人工智能的分支,后来也有不少统计学家加入,最近一、二十年因为其预测精度迅速提高而走红,并在业界有着广泛的应用。可以预见,在未来三十年,几乎所有行业都会因机器学习的深刻冲击而改变。MIT名誉校长Eric Grimson曾预言,机器学习会成为像Word一样的工具。而谁先掌握此工具,则可占得先机,成为时代的弄潮儿(至少不会落伍)。


或许你觉得机器学习(Machine Learning)对于你并没有什么实际用途。但事实上,至少已经有两波机器学习的大潮席卷了经管学科。第一波是以 LASSO 为代表的高维回归、惩罚回归,第二波为以决策树与随机森林(RandomForest)为代表的新型非参数回归与集成学习(Ensemble Learning),而以神经网络与深度学习(Deep Learning)的第三波也正在潮流涌动……


如何迅速上手机器学习及Python应用?陈强老师亲授的“机器学习及Python应用”四天现场班(北京,2024年7月),手把手讲解机器学习与Python应用,无疑是难得的捷径!


课程是提取机器学习的书籍的精髓,主要包含思想原理+数学精髓+案例讲解

陈强教授获得北京大学经济学学士、硕士,美国Northern Illinois University数学硕士、经济学博士,现为数量经济学博士生导师,在统计学、计量经济学及机器学习领域具有深厚的功底,2010年入选教育部新世纪优秀人才支持计划。陈强老师著有畅销研究生教材《高级计量经济学及Stata应用》(第2版,高教社,2014),以及《机器学习及R应用》(高教社,2020)与《机器学习及Python应用》(高教社,2021)。陈强老师特别擅长深入浅出、直指人心地介绍数据分析原理,深受广大学生们的喜爱,其现场班常常人满为患、好评如潮。


机器学习及Python应用

课程信息

培训时间:2025年1月16-19日 (四天)

培训地点:上海市(提供交通住宿指南)

授课安排:上午9:00-12:00;下午2:00-5:00;答疑5:00-6:00

课程费用:5200元/4800元(学生价,仅限全日制在读本科和硕士)

提供电子版发票及通知,纸质版结业证书

在线报名:https://www.peixun.net/main.php?mod=buy&cid=1771


授课大纲

第1讲  机器学习引论

(1) 什么是机器学习

(2) 机器学习的分类与术语

(3) 案例:垃圾邮件过滤;手写体数字识别;图像识别;自动驾驶


第2讲  Python语言快速入门

(1) Why Python?

(2) 安装Python与Spyder

(3) Python的模块(module)

(4) Python的对象(str, bool, list, tuple, dict, set)

(5) Python的函数(function)与方法(method)

(6)Numpy (ndarray),pandas(Series, Data Frame)

(7) sklearn(机器学习)与keras(深度学习)

(8) Python画图(Matplotlib, pandas, seaborn)

(9) Python面向对象编程


第3讲 数学回顾

(1) 梯度向量
(2) 方向导数

(3) 梯度下降

(4) 向量微分

(5) 最优化


第4讲 线性回归

(1) OLS

(2) 过拟合与泛化能力

(3) 偏差与方差的权衡

(4) 交叉验证

(5) Python案例:多项式回归的过拟合;波士顿房价


第5讲 逻辑回归

(1) Logit

(2) 几率比

(3) 灵敏度与特异度

(4) ROC与AUC

(5) 科恩的kappa

(6) Python案例:泰坦尼克号旅客的存活


第6讲 多项逻辑回归

(1) 多项Logit

(2) Python案例:识别玻璃类别


第7讲 惩罚回归

(1) 高维回归的挑战

(2) 岭回归(Ridge Regression)

(3) 套索估计(Lasso)

(4) 弹性网估计(Elastic Net)

(5) Python案例:前列腺癌的影响因素


第8讲 K近邻法

(1) 回归问题的K近邻法

(2) 分类问题的K近邻法

(3) Python案例:摩托车撞击实验数据;鸢尾花品种的归类;威斯康辛乳腺癌的诊断


第9讲 决策树

(1) 分类树(Classification Tree)

(2) 分裂准则(错分率、基尼指数、信息熵)

(3) 成本复杂性修枝

(4) 回归树(Regression Tree)

(5) Python案例:波士顿房价;葡萄牙银行市场营销


第10讲 随机森林

(1) 集成学习(Ensemble Learning)

(2) 装袋法(Bagging)

(3) 随机森林(Random Forest)

(4) 变量重要性(Variable Importance)

(5) 偏依赖图(Partial Dependence Plot)

(6) Python案例:波士顿房价;声呐信号的分类


第11讲 提升法

(1) 自适应提升法 (AdaBoost)

(2) AdaBoost的统计解释

(3) 梯度提升法 (Gradient Boosting Machine)

(4) XGBoost算法

(5) Python案例:波士顿房价;过滤垃圾邮件;识别玻璃类别


第12讲 支持向量机

(1) 最大间隔分类器(Maximal Margin Classifier)

(2) 软间隔分类器(Soft Margin Classifier)

(3) 支持向量机(Support Vector Machine)

(4) 核技巧(Kernel Trick)

(5) 支持向量回归(Support Vector Regression)

(6) Python案例:模拟数据;过滤垃圾邮件;识别手写数字;波士顿房价


第13讲  人工神经网络

(1) 人工神经网络的思想

(2) 感知机(Perceptron)

(3) 前馈神经网络(Feedforward Neural Network)

(4) 激活函数(Activation Function)

(5) 反向传播算法(Back-propagation Algorithm)

(6) 随机梯度下降(Stochastic Gradient Descent)

(7) 神经网络的过拟合与正则化

(8) 卷积神经网络(Convolution Neural Network)

(9) 深度学习的发展

(10) Python案例(sklearn与Keras):波士顿房价;过滤垃圾邮件;模拟数据;路透社新闻主题分类,手写数字数据集MNIST


第14讲(Bonus Lecture) 机器学习在经管社科的应用

精读几篇在经管社科顶刊发表的经典机器学习论文


不难看出,本次课程可谓干货满满、奇货可居。更难得可贵的是,主讲老师陈强教授具有丰富的教学经验、激情与魅力,是广大计量学子心目中真正的“计量男神”,尤其擅长化繁为简、直指人心,让学员们迅速上手新知识与技能。

陈强老师的Python机器学习现场班一年仅两场,错过就是180天的距离~


优惠信息

JG学术老学员9折优惠;

同一单位三人以上同时报名9折优惠;

同一单位六人以上同时报名8折优惠;

以上优惠与学生价均不叠加。


报名流程

1. 点击“https://www.peixun.net/main.php?mod=buy&cid=1771”,在线提交报名信息;

2. 在线订单支付,支持支付宝,微信,公务卡银联;

3. 确认发票信息,2个工作日连同通知发送至邮箱;

4. 开课前一周发送资料及上课事宜。


报名咨询:

尹老师

电话:13321178792

QQ:42884447

WeChat:JGxueshu

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python 机器学习 Flag Fla lag

已有 3 人评分经验 收起 理由
wwqqer + 100 精彩帖子
np84 + 100 精彩帖子
kychan + 80 精彩帖子

总评分: 经验 + 280   查看全部评分



沙发
资料狂人 在职认证  发表于 2021-12-28 09:40:00 |只看作者 |坛友微信交流群

往期“机器学习现场班”学员们的评论


  • 今天听了您的课,收获很多!

  • 谢谢陈老师!听您讲课受益良多!

  • 陈强老师的高维空间景色宜人……

  • 感谢陈老师!每次听课都收益匪浅!

  • 谢谢陈老师,这几天学了不少新的东西,辛苦了!

  • 近几日听您讲课收获很大,今后还要向您多多学习!

  • 今天上课干货满满……这两天参加您的培训,收获很大,希望未来有机会也请您到我们学校交流。

  • 陈老师好,以前都是读你的书,给学生推荐你的书和公众号,这几天听你讲课,信手拈来,深入浅出,果然是高手中的高手!

  • 之前一直听您的视频课,看公众号收获特别大。都打印装订成册了,老师你公众号写的特别生动,有的不好理解的地方一看您的比喻就豁然开朗了,都是原创的内容,特别有吸引力,真的可以再出一本书呢。今天第一次听机器学习,耳目一新呢,上了一天的课收获特别大。

  • 受益匪浅,陈老师辛苦了,祝陈老师假期愉快!

  • “机器学习哪家强,山东大学找陈强”。哈哈哈,谢谢陈老师深入浅出的讲解。收获颇丰,受益匪浅!

  • “人到中年不得已,机器学习来兜底”。同谢陈老师细致入微的讲解,受益匪浅!

  • 课程真的讲得太好了,在老师的课程中学到太多了!感谢陈老师,同样无比期待机器学习新书的出版!!

  • 下次开课,要推荐其他同学参加。很有收获!

  • 真是获益匪浅,感谢陈老师辛苦付出,期待陈老师新书,祝陈老师和大家假期愉快!

  • 感谢陈老师5天精彩且细致入微的讲解~出书一定推荐给其他同学!顺祝老师假期愉快!

  • 陈老师辛苦了!陈老师的课高屋建瓴又深入浅出,真的受益良多。感谢陈老师,祝陈老师假期愉快!

  • 五天时间不长,却像走过了一条漫长而幽暗的知识隧道,没有陈老师的火炬照亮前进方向,岂能穿越!非常感谢陈老师深入浅出、妙喻频出的授课!期待专著尽快出版!祝陈老师身体健康、学术之树长青!

  • 论文数据愁掉发,机器学习来开挂。这几天仿佛打开了新世界的大门。感谢陈老师!坐等陈老师新书出版。

  • 感谢陈老师,收获满满,期待以后继续和您学习!

  • 感谢陈老师,干货满满收获很大。听两次陈老师现场班了,陈老师总能复杂问题简单化、深入浅出,娓娓道来。难得的学习,感谢!

  • 感谢陈老师,也感谢主办方的老师,5天收获满满,期待以后再次相见!

  • 感谢陈老师!这五天收获良多。之前学过一些Python,但是陈老师的讲解更本质,使我对于Python的理解上了一个台阶。ML讲解更是深入浅出,很遗憾时间问题早离场了一会,期待能有机会跟随陈老师再学习。

  • 感谢陈老师,也感谢主办方!陈老师的课程和教材向来深入浅出,很适合学习和应用,期待以后再次相见!

  • 非常感谢和敬佩陈强老师!五天高密度教学,特别辛苦。讲解内容全面,深入浅出,很多点睛之语,直透本质,非有致广大尽精微之学养不能达!祝陈老师学术之树常青,桃李满天下!

  • 陈老师,这五天听完您机器学习的课真的是受益匪浅,太感谢您啦!希望以后还有机会能跟您学习。

  • 陈老师您好,很感谢您这两天的授课。作为机器学习小白,通过两天学习,有了一个快速了解,收获很大。在人大读博期间,您的书一直是我的重要参考书籍,反复学习。这次培训,有幸加您微信,很开心。您上课辛苦啦!

已有 1 人评分经验 收起 理由
kychan + 80 精彩帖子

总评分: 经验 + 80   查看全部评分



使用道具

藤椅
资料狂人 在职认证  发表于 2021-12-28 09:40:26 |只看作者 |坛友微信交流群
Q:什么是机器学习?

A:简单说,机器学习就是让机器(计算机)从数据中自主学习的能力。它的反面就是“硬编码”(hard coding)。假设你想写一个程序,让计算机识别正常邮件与垃圾邮件。硬编码的方法就是,由人类写下判别垃圾邮件的规则,再告诉计算机。此时,计算机并不学习,只是严格执行人类的死板分类规则。可以想象,硬编码的效果不会太好,因为虽然人类可直观地判定垃圾邮件,但并不知道自己是怎么做到的。反之,机器学习的方法则给予计算机大量的邮件,经过人类标注为垃圾邮件或正常邮件,然后让计算机找出这两类邮件的差异规律(比如常见词的不同词频),并用学到的规律(其实就是一个函数映射,即从词频到邮件类别的映射)对新邮件进行分类。

使用道具

板凳
资料狂人 在职认证  发表于 2021-12-28 09:40:44 |只看作者 |坛友微信交流群

Q:为什么机器学习这么“火”?

A:由于机器学习专注于预测,故在业界有很多应用。特别是最近二、三十年,机器学习(包括深度学习)发展很快,预测错误率不断下降(特别在图像识别,自然语言处理领域)。一般来说,机器学习的预测错误率可能比传统的统计或计量方法低一个数量级,比如前者的错误率为1%,而后者的错误率为10%。原因之一是,传统的统计或计量经济学十分强大模型的可解释性(interpretability),故大量使用线性模型,而现实世界存在很多非线性。

使用道具

报纸
资料狂人 在职认证  发表于 2021-12-28 09:40:55 |只看作者 |坛友微信交流群
Q:既然机器学习的优势在于预测,而我作为经管或社科类的学者,只关心因果推断,有必要学机器学习吗?

A:事实上,因果推断的本质也是预测问题。根据鲁宾的因果模型(Rubin's Causal Model),因果效应通过“潜在结果”(potential outcome)来定义,即政策实施后的“观测结果”(observedoutcome)与政策如果未实施的“反事实结果”(counterfactual outcome)之差。显然,反事实结果不可观测,只能在一定假设之下进行估计与预测。

使用道具

地板
资料狂人 在职认证  发表于 2021-12-28 09:41:09 |只看作者 |坛友微信交流群
Q:目前机器学习在计量经济学中有哪些应用?未来的发展趋势如何?

A:迄今为止(尤其是最近十年),机器学习已经在计量经济学中掀起了两波应用的浪潮。第一波浪潮为MIT的Chernozhukov教授等将Lasso系列的惩罚回归方法引入计量经济学,提出了post double selection lasso,IV lasso,double machine learning等适用于因果推断的机器学习方法。第二波浪潮为Stanford的Susan Athey教授等将基于决策树(tree-based)的机器学习方法引入计量经济学,提出了causal tree,causal forest,local linear forest与generalized random forest等方法(不少论文刚发表或仍为工作论文)。在可预见的将来,机器学习方法将加速融入计量经济学,成为计量经济学的重要组成部分,尤其在非参数估计与半参数估计领域。这是因为,传统的统计与计量的非参方法主要为基于核(kernel)的局部回归,很难推广到高维(因为存在维度灾难,curse ofdimensionality),而机器学习方法(比如基于决策树的随机森林、梯度提升法)在高维空间依然适用,而且预测准确率更高。

使用道具

7
资料狂人 在职认证  发表于 2021-12-28 09:41:29 |只看作者 |坛友微信交流群
Q:作为经管或社科类的学者或学生,我应该学机器学习吗?

A:在几年前,如果你知道Lasso,说明你是先进的;但现在已经很难这么说了。再过几年,如果你还不知道Lasso,则很可能说明你是落后的,因为关于Lasso的知识正在加速普及。类似地,如果你现在就知道随机森林(random forest),说明你是先进的;……。在科研的道路上,抢占先机无疑十分重要。你的选择决定了你究竟是先知先觉,还是后知后觉……

使用道具

8
资料狂人 在职认证  发表于 2021-12-28 09:41:48 |只看作者 |坛友微信交流群
Q:我是文科生,能学会机器学习吗?

A:如果你学过统计学或计量经济学,应该很容易上手机器学习。在某种意义上,机器学习比计量经济学更简单。机器学习主要关心“算法”(algorithm),所用数学基本上就是最优化(optimization),一般并不使用统计学或计量经济学的那些复杂的渐近理论(asymptotics)。而且有些传统的统计与计量方法,也是机器学习的常用方法,比如OLS、Logit、多项Logit等,这些你本来就会啊。
已有 1 人评分经验 收起 理由
kychan + 80 精彩帖子

总评分: 经验 + 80   查看全部评分

使用道具

9
yao203 发表于 2021-12-28 10:30:18 |只看作者 |坛友微信交流群

回帖奖励 +5 个论坛币

使用道具

10
1jian.fun 企业认证  学生认证  发表于 2021-12-28 10:50:33 |只看作者 |坛友微信交流群

回帖奖励 +5 个论坛币

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 12:40