请选择 进入手机版 | 继续访问电脑版
楼主: 资料狂人
3643 45

[学科前沿] Python机器学习学术应用_2021年4月周末远程班 [分享]

回帖奖励 72 个论坛币 回复本帖可获得 3 个论坛币奖励! 每人限 1 次

VIP管理员

泰斗

79%

还不是VIP/贵宾

-

威望
9
论坛币
985425651 个
通用积分
26291.8485
学术水平
4539 点
热心指数
3319 点
信用等级
3543 点
经验
577182 点
帖子
8143
精华
142
在线时间
15353 小时
注册时间
2010-3-28
最后登录
2021-3-2

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

资料狂人 在职认证  发表于 2020-12-1 09:25:04 |显示全部楼层

Python机器学习学术应用三问:

?  机器学习难吗

?  机器学习的学习核心是什么

?  机器学习如何用于学术研究


也许你在很多平台看过Python的免费课程

也许你在很多推文看过Python的广告

BUT

Python机器学习与学术应用相关的却寥寥无几……


Python机器学习学术应用:https://v.qq.com/x/page/d3207z1lc4n.html


Python机器学习学术应用周末班

从机器学习学术应用介绍到机器学习核心算法到机器学习学术应用指导,大牛导师级陈远祥老师亲授丨特别赠送Python编程基础课程(单独售价1000元)

冬日暖心价:五天远程班+全部资料+录播回放+1000元的Python编程基础课程=4000元

提供发票,开课通知和结业证书


上课时间:2021年4月3-5,10-11日(周末五天)

课程安排:9:00-12:00, 13:30-16:30; 答疑

上课方式:远程直播,提供录播回放

课程费用:4000元

在线报名:http://www.peixun.net/main.php?mod=buy&cid=1735


讲师介绍:

陈远祥,北京邮电大学副教授 。2014年毕业于北京大学,获通信与信息系统专业博士学位,2015年-2017年在北京大学做博士后研究。

发表SCI/EI学术论文80余篇,其中第一或通讯作者论文40余篇,申请发明专利4项。

主持国家自然科学基金面上项目,国家重点研发计划子课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。

IEEE、OSA会员,OpticsExpress, IEEE Photonics Technology Letters,Photonics Journal,Applied Optics等多个SCI期刊审稿人。


预习课程:Python编程基础

Python基础

1.     Python语言概述

2.     标准数据类型

3.     控制流

4.     函数

5.     os文件处理模块

Python重要数据科学计算库

1.     numpy

2.     pandas

3.     matplotlib

4.     pyecharts


正式课程:

第一部分:(0.5天)机器学习学术应用介绍:

机器学习基本思想

常用机器学习算法模型

机器学习算法库介绍

机器学习在学术领域应用场景


第二部分:算法原理与实战(4天)

1、KNN算法:

KNN算法基本原理

常用相似度衡量方法、KNN用于分类和回归

KNN模型参数优化

Python案例:KNN用于鸢尾花数据集分类


2、决策树:

决策树基本原理

决策树分类

决策树用于分类和回归实现

决策树参数优化

Python案例:决策树实现波士顿房价预测


3、线性回归:

线性回归的求解、岭回归、LASSO和弹性网

Python案例:线性回归实现鲍鱼年龄预测


4逻辑回归

逻辑回归基本原理

从线性回归到逻辑回归

逻辑回归实现和参数优化

Python案例:逻辑回归实现病马死亡率预测


5、神经网络:

神经网络基础

神经网络中的激活函数

神经网络Python实现与参数调优

Python案例:手写数字识别


6、贝叶斯网络:

贝叶斯分类原理

朴素贝叶斯

贝叶斯模型分类

Python案例:垃圾邮件过滤


7、支持向量机:

支持向量机分类原理

线性SVM和非线性SVM

Python案例:人脸识别


8、随机森林:

决策树与随机森林

随机森林原理

随机森林Python实现与参数调优

Python案例:随机森林用于泰坦尼克沉船预测


9、聚类:

聚类原理

聚类和分类

k-means聚类原理

k-means python实现

Python案例:聚类用于客户价值识别


第三部分:Python机器学习学术应用指导(0.5天)

数据发现与变量创造,预测,因果推断;

文本大数据应用;

基于机器学习的学术论文写作指导


优惠:

现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;

同一单位六人以上同时报名8折优惠;

以上优惠不叠加。

PS:参加12月机器学习课程可以8折优惠购买陈远祥老师的爬虫及文本分析课程。


报名流程:

1,点击“http://www.peixun.net/main.php?mod=buy&cid=1735”,在线提交报名信息;

2,经管之家账号登录,提单支付;

3,开课前一周发送上课资料,开课前一天测试远程会议;

4,快递发票,开课通知;课后发送结业证书。


联系方式:

尹老师

电话:010-53352991

QQ:42884447

WeChat:yinyinan888                           

尹老师微信二维码.png

关键词:python 机器学习 国家自然科学基金青年项目 Technology Matplotlib

已有 2 人评分经验 收起 理由
冰枫冷羽 + 80 精彩帖子
xujingtang + 80 精彩帖子

总评分: 经验 + 160   查看全部评分



stata SPSS
资料狂人 在职认证  发表于 2020-12-1 09:27:26 |显示全部楼层

Python编程基础:

1 Python爬虫与文本分析概述

1.1 文本数据的重要性

1.1.1 结构化数据

1.1.2 非结构化数据

1.1.3 文本数据


1.2 文本分析

1.2.1 文本分析基本概念

1.2.2 文本分析与自然语言处理的关系

1.2.3 爬虫与文本分析


2 Python基础

2.1 Python语言概述

2.1.1 起源

2.1.2 语言特色

2.1.3 开发环境配置


2.2 标准数据类型

2.2.1 bool(布尔)

2.2.2 number(数字)

2.2.3 string(字符串)

2.2.4 list(列表)

2.2.5 tuple(元组)

2.2.6 dictionary(字典)

2.2.7 set(集合)


2.3 控制流

2.3.1 顺序

2.3.2 选择

2.3.3 循环

2.3.4 异常处理


2.4 函数

2.4.1 定义函数

2.4.2 调用函数

2.4.3 匿名函数


2.5 os文件处理模块

2.5.1 文件目录操作

2.5.2 文件读写


3 Python重要数据科学计算库

3.1 numpy

3.1.1 数组的创建

3.1.2 数组常用内置方法

3.1.3 数据类型的转换

3.1.4 数组的索引

3.1.5 变换数组的形态

3.1.6 数组的运算

3.1.7 常用统计函数


3.2 pandas

3.2.1 数据帧的创建

3.2.2 索引与过滤

3.2.3 增加和删除

3.2.4 缺失值处理

3.2.5 数据整理

3.2.6 统计和描述

3.2.7 数据的合并和分组运算

3.2.8 数据的读写和查看


3.3 matplotlib

3.3.1 快速绘图

3.3.2 绘制子图

3.3.3 添加文字说明和注释

3.3.4 散点图

3.3.5 对数坐标图

3.3.6 极坐标图

3.3.7 饼图

3.3.8 柱状图

3.3.9 直方图

3.3.10 箱线图


3.4 pyecharts

3.4.1 柱状图/条形图

3.4.2 箱型图

3.4.3 热力图

3.4.4 折线图

3.4.5 散点图

3.4.6 漏斗图

3.4.7 饼图

3.4.8 词云图

3.4.9 3D图表




回复

使用道具 举报

资料狂人 在职认证  发表于 2020-12-1 09:27:36 |显示全部楼层
Python爬虫学术应用

4 爬虫

4.1 爬虫基础

4.1.1 爬虫基本概念

4.1.2 通用爬虫和聚焦爬虫

4.1.3 http的请求与响应

4.1.4 网页基础知识


4.2 简单爬虫实现

4.2.1 爬虫基本原理

4.2.2 爬虫与反爬虫

4.2.3 正则表达式

4.2.4 requests库实现http请求

4.2.4.1 实战1:豆瓣电影分类排行榜(JSON数据格式)

4.2.4.2 实战2:猫眼电影排行榜数据提取

4.2.4.3 实战3:基于cookies爬取豆瓣短评分析

4.2.5 Beautiful Soup

4.2.5.1 网页的解析

4.2.5.2 网页元素的选取

4.2.5.3 实战:从中国天气网获得天气数据;爬取豆瓣电视剧评分


4.3 爬虫高级技术进阶

4.3.1 多页面的爬取

4.3.2 动态渲染页面的爬取

4.3.3 基于selenium的自动化爬取技术

4.3.4 实战:多页面爬取京东商品数据




回复

使用道具 举报

资料狂人 在职认证  发表于 2020-12-1 09:27:47 |显示全部楼层
Python文本分析学术应用

5 文本分析

5.1 文本分析概述

5.1.1 自然语言处理的层次

5.1.2 自然语言处理的难点

5.1.3 自然语言处理的流派


5.2 文本分析关键技术

5.2.1 常用文本整理和清洗方法

5.2.1.1 句子拆分

5.2.1.2 词拆分

5.2.1.3 过滤重复的单词

5.2.1.4 删除停用词

5.2.1.5 拼写检查

5.2.1.6 大小写变换

5.2.1.7 文本翻译

5.2.1.8 词干提取

5.2.1.9 提取电子邮件或URL

5.2.2 中文分词技术

5.2.2.1 规则分词

5.2.2.2 统计分词

5.2.2.3 混合分词

5.2.2.4 实战:结巴分词,对爬取的豆瓣数据分析,统计词频,绘制词云图

5.2.3 词性标注与命名实体识别

5.2.3.1 词性标注

5.2.3.2 命名实体识别

5.2.3.3 实战:基于jiebaku 的词性标注和基于HanLP的命名实体识别

5.2.4 文本向量化

5.2.4.1 离散化表示

5.2.4.2 分布式表示

5.2.4.3 实战:利用word2vec计算西游记中人物相似性

5.2.5 关键词提取

5.2.5.1 TF-IDF算法

5.2.5.2 TextRank算法

5.2.5.3 LDA算法

5.2.5.4 实战:基于LDA主题模型进行新闻关键词提取

5.2.5.5 实战:网页相似性分析

5.2.6 文本分类

5.2.6.1 分类算法介绍

5.2.6.2 实战:贝叶斯新闻分类

5.2.6.3 实战:虚假评论分类

5.2.7 文本聚类

5.2.7.1 kmeans算法介绍

5.2.7.2 实战:百度百科数据聚类

5.2.7.3 实战:豆瓣书籍数据聚类

5.2.8 文本情感分析

5.2.8.1 基于规则的情感分析

5.2.8.2 基于机器学习模型的情感分析

5.2.8.3 实战:基于豆瓣电影的情感分析

5.2.8.4 实战:在线情感分析系统




回复

使用道具 举报

资料狂人 在职认证  发表于 2020-12-1 09:27:57 |显示全部楼层
Python爬虫与文本挖掘-爬虫专题

直播内容:

1,大数据时代背景介绍
2,大数据与文本数据
3,爬虫与文本数据介绍
4,爬虫的学术价值和应用
5,爬虫学术实战-通过关键字获取谷歌学术搜索结果




回复

使用道具 举报

资料狂人 在职认证  发表于 2020-12-1 09:28:24 |显示全部楼层
Python爬虫与文本挖掘-文本挖掘专题

直播内容:

文本挖掘基本概念

文本挖掘的常见商业应用

文本挖掘的层次

文本挖掘的流程

文本挖掘的挑战

文本挖掘实战:

1. 从豆瓣爬取评论数据并绘制词云图

2. 西游记人物相似性分析






回复

使用道具 举报

xjg 发表于 2020-12-1 10:02:38 |显示全部楼层

回帖奖励 +3 个论坛币

回复

使用道具 举报

三重虫 发表于 2020-12-1 10:41:00 |显示全部楼层

回帖奖励 +3 个论坛币

回复

使用道具 举报

西门高 发表于 2020-12-1 11:23:48 |显示全部楼层

回帖奖励 +3 个论坛币

支持一下
回复

使用道具 举报

huhuhuhu 发表于 2020-12-1 11:37:02 |显示全部楼层

回帖奖励 +3 个论坛币

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2021-3-2 15:51