R作为免费、开源、庞大社区支持的统计计算和作图的语言,提供了大量的第三方功能包,其内容涵盖了从统计计算到机器学习,从金融分析到生物信息,从社会网络分析到自然语言处理,从各种数据库各种语言接口到高性能计算模型等各个方面,正在获得越来越多数据分析从业人员的喜爱,也是数据分析师(科学家)必备的职业技能要求。
————————上课时间——4天 ———————————
上课时间:2017年2月18日开始
周六、周日早上 9:00-12:00 13:30-16:30,每天6h,一共4天,具体以开课通知为准
课程形式:线上直播
报名方式:戳后面二维码参团报名
——————— 课程看点+show time——————————
1、R语言数据清洗(tidyr,dplyr,stringr,reshape2,ggplot2)
2、机器学习算法(提升算法、决策树、SVM、神经网络、KNN、关联规则)
3、可视化(交通地图数据可视化实战)
4、代码+数据+逐一讲解,每天练习不能停~
—————————主讲人介绍 ——————————————
余文华
擅长数据挖掘、数据可视化、机器学习领域。
发表医学领域数据挖掘相关论文数十篇,英文SCI论文3篇。任职多家医学信息公司数据分析顾问。现从事数据挖掘相关工作。
——————最最最重要的 “报名”环节 ——————————
网页版入口:http://www.peixun.net/view/833.html
——————————更多免费资料请关注“CDA网校”———————————
(AIU人工智能-机器学习参团群,QQ群:346390869,领取免费学习资料)
—————————课程大纲——————————————
第一课:机器学习基本理论
· 机器学习概述
· 机器学习算法分类及知识框架
· 机器学习相关概念
· 机器学习一般步骤
· 案例:用R实现机器学习模型预测
第二课:R语法基础
· R语言基础语法
· 数据处理常用R包介绍(tidyr,dplyr,stringr,reshape2,ggplot2)
· 数据的存取与编辑
· 非结构化数据的读取
· 案例:用R实现MySQL数据库数据读取
第三课:数据清洗方法
· 缺失数据处理
· 异常值的辨识处理
· 不平衡数据的处理
· 特征提取与特征工程
· 案例:针对美国人群收入等数据进行数据清洗
第四课:线性回归与Logistic回归
· 线性回归与最小二乘法
· Lasso回归及岭回归
· Logistic回归模型
· 多分类Logistic回归模型
· 案例:运用Logistic回归模型预测学生录取情况
第五课:K最近邻(KNN)算法
· k近邻算法原理
· k近邻算法R实现
· 案例:运用KNN实现前列腺癌症检测
第六课:聚类算法
· 聚类算法原理
· 聚类算法R实现
· 案例:运用聚类分析进行离群点识别
第七课:基于决策树类型算法介绍
· 决策树算法
· 随机森林算法
第八课:提升算法
· Adaboost算法
· GBDT算法
· XGBoost
· 案例:针对美国人群收入预测模型比较
第九课:SVM支持向量机算法介绍
· SVM基本原理
· SVM算法的R实现
第十课:人工神经网络
· 人工神经网络(RNN)
· 深度学习
· 案例:运用神经网络实现手写数字识别
第十一课:地图可视化:上海交通地图数据可视化实战
· 数据可视化基本图形选择汇总
· 绘制数据地图常用方法
· 交互式可视化实战
第十二课:机器学习mlr包:债务预测实战
· mlr包介绍
· 实际问题分析及数据处理
· 多种分类算法模型的比较
· 模型评价方法汇总
· 机器学习课程总结