Python学习路径建议:
编程基础及数据清洗
→(爬虫)
→机器学习
→文本分析&机器学习进阶
为学术研究量身打造
提供发票,开课通知和结业证书
Python师资培训课程矩阵:
课程信息
课程时长:
编程基础:918分钟
爬虫:611分钟
文本:611分钟
机器学习:1800分钟
深度学习:1400分钟
上课方式:在线学习,提供全部资料及答疑
→授课与答疑均是授课老师陈远祥本人,非助教答疑
→不同于其他Python课程,单独为学术研究打造的Python机器学习学术应用课程
授课嘉宾简介
陈远祥老师,北京邮电大学副教授 。2014年毕业于北京大学,获通信与信息系统专业博士学位,2015年-2017年在北京大学做博士后研究。
发表SCI/EI学术论文100余篇,其中第一或通讯作者论文60余篇,申请发明专利20项。
主持国家自然科学基金面上项目,国家重点研发计划子课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。
IEEE、OSA会员,OpticsExpress, IEEE Photonics Technology Letters,PhotonicsJournal,Applied Optics等多个SCI期刊审稿人。
课程内容:
Python编程基础
C1:前言
1. Python的重要性
2. 计算机基础知识简介
C2:Python语言概述
1. Python起源
2. Python语言特色
3. 开发环境配置
4. 代码编写规范
5. turtle库的基本操作
6. turtle绘图
C3:Python中的数据类型
1. Python中的变量管理
2. Python中的数据类型
3. 布尔类型
4. 数字类型
5.1 字符串基本操作
5.2 字符串内置处理函数
5.3 字符串常用方法
5.4 字符串格式化
6.1 列表的索引和切片
6.2 列表元素的修改
6.3 列表元素的添加
6.4 列表元素的删除
6.5 列表元素计算和排序
6.6 列表常用内置函数
6.7 列表推导式
7.1 元组基本概念
7.2 序列解包
7.3 生成器表达式
8.1 字典的基本概念
8.2 字典元素的读取
8.3 字典元素的添加和修改
8.4 字典推导式
8.5 字典应用1
8.6 字典应用2
9. 集合
10. 三国人物统计案例
C4:控制流
1. 程序流程图
2. 条件表达式
3. 单分支选择结构
4. 多分支选择结构
5.1 选择结构应用1
5.2 选择结构应用2
6. for循环
7. while循环
8. 异常处理
9. 案例实战
C5:函数设计与使用
1. 函数定义与调用
2. 形参与实参
3. 参数的传递
4. return语句
5. 变量的作用域
6. lambda表达式
7. 案例应用-计算三角形的周长
8. 递归-阶乘应用
9. 递归-字符串反转
10. 递归-科赫雪花
11. 模块化编程思想
12. 第三方库的安装与导入
C6:面向对象编程
1. 面向过程与面向对象
2. 类
3. 类的初始化和增加类的方法
4. 类成员变量和实例成员变量
5. 私有类成员和公有类成员
6. 案例实战:烧鸡翅
C7:文件操作
1. 文件的基本概念
2. 文件路径的操作
3. 文本文本常用方法
4. 案例实战:文本文件的读写
C8:Numpy
1. numpy的引入
2. 数组的属性
3. 数组的创建
4. 数组的数据类型
5. 一维数组元素的索引
6. 多维数组的索引
7. 变换数组的形态
8. 数组的广播机制
9. 矩阵操作
10. numpy数据的保存和读取
11. 排序
12. 重复和去重复
13. 数组的填充
14. numpy常用统计函数
15. 鸢尾花数据集分析
16. 随机漫步
C9:pandas
1. pandas-dataframe的创建
2. pandas-dataframe的索引与过滤
3. pandas-dataframe的增加和删除
4. pandas-缺失值的判断和删除
5. pandas-缺失值的填充和替换
6. pandas-dataframe的算术运算
7. pandas-dataframe的堆叠与合并
8. pandas-dataframe的分组运算
9. pandas-文件的读写和查看
C10:matplotlib绘图
1. matplotlib-快速绘图
2. matplotlib-绘制子图
3.matplotlib-添加注释和说明
4. matplotlib-散点图
5. matplotlib-极坐标图
6. matplotlib-饼图
7. matplotlib-柱状图
8. matplotlib-直方图
9.matplotlib-箱线图
C11:pyechart绘图
1. pyechart-柱状图
2. pyechart-箱线图
3. pyechart-热力图
4. pyechart-折线图
5. pyechart-散点图
6. pyechart-漏斗图
7. pyechart-饼图
8. pyechart-词云图
9. pyechart-3D柱状图
10. pyechart-动态图
11. pyechart-其他图表
Python爬虫
1. 爬虫基础
1.1 爬虫基本概念
1.2 通用爬虫和聚焦爬虫
1.3 http的请求与响应
1.4 网页基础知识
2. 简单爬虫实现
2.1 爬虫基本原理
2.2 爬虫与反爬虫
2.3 正则表达式
2.4 requests库实现http请求
2.4.1 实战1:豆瓣电影分类排行榜(JSON数据格式)
2.4.2 实战2:猫眼电影排行榜数据提取
2.4.3 实战3:基于cookies爬取豆瓣短评分析
2.5 BeautifulSoup
2.5.1 网页的解析
2.5.2 网页元素的选取
2.5.3 实战:从中国天气网获得天气数据;爬取豆瓣电视剧评分
3. 爬虫高级技术进阶
3.1 多页面的爬取
3.2 动态渲染页面的爬取
3.3 基于selenium的自动化爬取技术
3.4 实战:多页面爬取京东商品数据
Python文本分析
1. 文本处理常用字符串方法精讲
- 字符串的不变性
- 排序行
- 段落格式化
- 二进制转化为ASCII
- 重复字词过滤
- 提取邮件地址
- 提取URL地址
- 大写转换
- 符号化
- 删除停用词
- 同义词与反义词处理
- 文本翻译
- 单词替换
- 拼写检查
- WordNet接口
- 语料访问
- 标记单词
- 块和裂口
- 块分类
- 文本分类
- 双字母组
- 文字改写
- 文字换行
- 频率分布
- 文字摘要
- 词干算法
- 约束搜索
- numpy数值计算要点串讲
- Pandas数据处理串讲
- python统计图表展示
2. 重要的库
jieba库简介
3. 关键词提取
- 关键词任务概述
- TF-IDF算法原理
- 相似文章推荐原理介绍
- 实例:红楼梦文本分析的实现
- 文件与词库的读取
- 完成分词与词云图的绘制
4. 文本分类
- 新闻素材介绍
- 新闻内容的关键词提取
- 词向量转化与ngram模型
- 朴素贝叶斯算法完成新闻分类
5. 文本聚类
语料的加载,文本特征的提取,利用聚类算法对文本进行聚类
机器学习课程:
第一部分:机器学习学术应用介绍
- 机器学习基本思想
- 常用机器学习算法模型
- 机器学习算法库介绍
- 机器学习在学术领域应用场景
第二部分:算法原理与实战
1、KNN算法:
- KNN算法基本原理
- 常用相似度衡量方法、KNN用于分类和回归
- KNN模型参数优化
- Python案例:KNN用于鸢尾花数据集分类
2、决策树:
- 决策树基本原理
- 决策树分类
- 决策树用于分类和回归实现
- 决策树参数优化
- Python案例:决策树实现波士顿房价预测
3、线性回归:
- 线性回归的求解、岭回归、LASSO和弹性网
- Python案例:线性回归实现鲍鱼年龄预测
4、逻辑 回归:
- 逻辑 回归基本原理
- 从线性回归到逻辑 回归
- 逻辑 回归实现和参数优化
- Python案例:逻辑 回归实现病马死亡率预测
5、神经网络:
- 神经网络基础
- 神经网络中的激活函数
- 神经网络Python实现与参数调优
- Python案例:手写数字识别
6、贝叶斯网络:
- 贝叶斯分类原理
- 朴素贝叶斯
- 贝叶斯模型分类
- Python案例:垃圾邮件过滤
7、支持向量机:
- 支持向量机分类原理
- 线性SVM和非线性SVM
- Python案例:人脸识别
8、随机森林:
- 决策树与随机森林
- 随机森林原理
- 随机森林Python实现与参数调优
- Python案例:随机森林用于泰坦尼克沉船预测
9、聚类:
- 聚类原理
- 聚类和分类
- k-means聚类原理
- k-means python实现
- Python案例:聚类用于客户价值识别
第三部分:Python机器学习学术应用指导
- 数据发现与变量创造,预测,因果推断;
- 文本大数据应用;
- 基于机器学习的学术论文写作指导
机器学习进阶课程:
一、 集成学习介绍与应用
1. 集成学习的优势
2. 集成学习常用算法介绍:原理与实现
1) 随机森林
2) adaboost
3) GBDT
4) Xgboost
5) Stacking
3. 集成学习算法的学术应用
二、 高级特征工程处理技术
1. 特征工程的重要性
2. 常用特征工程处理技术:
1) 特征选择
2) 特征构造
3) 特征转换
4) 特征学习
3. 特征工程的在学术研究中的应用
三、 神经网络与深度学习
1. 神经网络的引入,为什么需要深度学习?
2. 深度学习常用模型介绍与应用:
1) 卷积神经网络与图像处理
2) 循环神经网络与文本分析
3) 多模态网络与应用
3. 深度学习在学术研究中的应用:
1) 股票市场预测
2) 信用风险评估
3) 资产定价
课程费用
- 编程基础:1300元
- 爬虫:2000元
- 文本:3000元
- 机器学习:4000元
- 机器学习进阶:4200元
提供电子版发票及开课通知,结业证书
报名链接
- 编程基础:https://www.peixun.net/main.php?mod=buy&cid=1874
- 爬虫:https://www.peixun.net/main.php?mod=buy&cid=1596
- 文本:https://www.peixun.net/main.php?mod=buy&cid=1597
- 机器学习:https://www.peixun.net/main.php?mod=buy&cid=1735
- 机器学习进阶:https://www.peixun.net/main.php?mod=buy&cid=1851
试听及课程咨询
尹老师
电话:13321178792
QQ:42884447
WeChat:JGxueshu