如果说2018年以前R是数据学术界的主流,那么2018年以后Python正在慢慢取代R在学术界的地位。
Python与R相比速度要快。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。所以有人说:Python=R+SQL/Hive,并不是没有道理的。
Python的一个最明显的优势在于其胶水语言的特性,很多书里也都会提到这一点,一些底层用C写的算法封装在Python包里后性能非常高效(Python的数据挖掘包Orange Canvas 中的决策树分析50万用户10秒出结果,用R几个小时也出不来,8G内存全部占满)。
Python已经成为越来越多美国顶级大学的计算机编程入门语言了。美国计算机排名顶尖的麻省理工学院和加州大学伯克利分校已经将他们的计算机编程入门教学语言改为了 Python。
用Python来做整个流程的框架,然后核心的CPU密集操作部分调用C函数,这样开发效率和性能都不错,因此学习Python已经是想从事大数据事业不可或缺的一门技能。
首次采用线上远程学习方式
初级班:掌握主流大数据与人工智能编程语言Python的基础及主要库操作。并以经典案例作为基础部分结课。
高级班:掌握主流机器学习算法,并结合经典案例,训练使用机器学习算法解决实际问题的思路和能力。
【课程特色】
1,远程答疑不影响任何效果;
2,录制视频,方便后期回看复习;
3,学术学习资料大礼包一份;
4,Peixun.net会员一个月,在线视频全含;
5,课后赠送VIP2账号15个月,用于后期学习;
6,年度赠书一本;
7,后续相同课程现场班可以五折优惠参加。
开课信息:
上课时间:
初级:2020年5月8-10日(三天远程线上)
高级:2020年5月16-17日 /30-31日(四天远程线上)
上课地点:远程线上授课(开课前一周发送交通住宿指南)
现场费用:(同时报名九折优惠)
初级:3500元;高级:5500元;
每天授课:上午9:00-12:00;下午13:30-16:30;16:30-17:00答疑
报名链接:
初级:http://www.peixun.net/main.php?mod=buy&cid=1470
高级:http://www.peixun.net/main.php?mod=buy&cid=1471
讲师介绍:
初级班:傅老师,金融数学博士,某知名高校商学院副教授。
主要从事金融数学,金融数据分析等领域的研究,发表SCI,EI,CSSCI核心期刊论文多篇。傅老师高校从教14年,主要讲授统计学、信用风险建模、金融数据挖掘等课程,先后指导学生获得全国数学模型竞赛和美国数学建模竞赛一等奖。 在具体行业方面,傅老师先后担任过咨询公司、互联网金融机构、数据管理公司的高级数据分析顾问,先后参与过客户估值、反欺诈识别、舆情分析等数据分析项目,有着丰富的行业经验。 同时具有丰富的教学讲解经验,课程生动形象,风格通俗易懂,深受学员的喜爱。
高级班:李御玺,国立台湾大学计算机工程博士,铭传大学计算机工程学系教授兼系主任暨所长。其研究领域专注于数据仓储、数据挖掘、与数据库设计。
在其相关研究领域已发表超过250篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。服务过的客户包括:中国工商局、台新银行、联邦银行、新光银行、新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、美商大都会人寿、嘉义基督教医院、微软、全国意向顾问股份有限公司、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、汽车行业如福特(Ford)公司;政府行业如国税局、台北市国税局、台湾省北区国税局、台湾省南区国税局、高雄市国税局等。
全程助教:曹鑫,CDA联合创始人,前四大会计师事务所咨询团队咨询顾问。
课程大纲初级班:
前期准备
预习视频:Python基础语法(pandas、numpy、条件语句、循环语句)
系统配置:助教远程安装Anaconda(包括Python、Jupyter、extensions)
Part1 可视化(约1.5天)(1)厉兵秣马——Python简介与Jupyter配置
样例
内容简介:学习基本的环境设置,为后期的代码编辑做准备。
(2)雾里看花——可视化基本逻辑与主要误区
内容简介:
数据可视化是什么?
数据可视化如何在不同的商业场景中进行应用?
当下热门的 “一图看天下”是什么?
数据可视化的误区有哪些?
(3)无中生有——变量的理解与随机数据生成
样例
内容简介:
产生模拟的数据
对数据进行拼接
对数据进行分割
l数据的筛选与补充
(4)循序渐进——散点图与条形图的进化过程
样例
内容简介:
散点图和条形图的适用数据类型
散点图的主要参数
条形图的主要参数
散点图与条形图的实现
可视化过程中的数据降维问题
(5)渐入佳境——用饼图与环形图呈现数据比例
样例
内容简介:
饼图与环形图的适用场景
饼图与环形图的关联与区别
饼图与环形图的重要参数
饼图与环形图的代码实现
(6)秘境寻踪——南丁格尔的往事与玫瑰花图
样例
内容简介:
南丁格尔与玫瑰花图的起源
玫瑰花图的基本原理
玫瑰花图的衍生
相关图像的代码实现
(7)有条不紊——折线图的设计与多线条呈现
样例
内容简介:
折线图的应用范围
折线图的主要参数
折线图的代码实现
多折线的呈现技巧
样例
内容简介:
什么是数据分布
数据分布与异常值
分布与箱线图的主要参数
分布与箱线图的代码实现
(9)抽丝剥茧——关联与配对图的相关性识别
样例
内容简介:
关联图与配对图的关系与区别
什么是相关性
关联图与配对图的主要参数
关联图与配对图的代码实现
图像内涵的信息解释
(10)冰火相融——日历热力图中的周期性探索
样例
内容简介:
热图的使用场景
热图的数据要求
热图的核心参数
热图的代码实现
如何解读热图
Part2 基础建模(约1.5天)
(1)线性回归——车位价格的预测
内容简介:
线性回归模型简介
线性回归模型检验
基于python的线性回归模型实现
样例
(2)决策树——平台风险识别
内容简介:
决策树的基本概念:信息熵、信息增益、GINI
决策树的剪枝
基于python的决策树模型实现
样例
(3)聚类分析——城市的特征分析
内容简介:
常用聚类模型简介:层次聚类、K均值聚类、密度聚类
基于python的层次聚类模型实现
样例
课程大纲高级班:
第一天
利用文本分析进行网络舆情分析
利用文本分析进行命名实体识别
——
文本分析简介及文本分析流程
中文分词方法
中文词性标注方法
关键词提取方法
命名实体识别
文本分析模型实作与比较: 以网络舆情分析模型及命名实体识别为例
第二天
利用文本分析进行新闻文件分类及新闻文件摘要
利用深度学习模型建置人脸识别及物体侦测模型
——
新闻文件分类方法
中文文本摘要方法
人脸识别及应用
OpenCV及Dlib简介
人脸侦测及人脸68个特征撷取
人脸识别(利用ResNet)
物体检测与定位及应用
目标检测技术概述
YOLOv3简介及COCO 数据集(80类people (人),bicycle(自行车),car(汽车)...等数据)
物体定位
物体检测
文本分析及深度学习模型实作与比较: 以新闻文件分类与摘要及人脸识别及物体侦测模型为例
第三天
利用半监督学习技术进行电信业客户流失模型的建置
利用深度学习技术进行信用卡盗刷预测模型建置
——
传统监督学习方法与非监督学习方法
半监督学习方法概述
半监督学习模型实作与比较: 以电信业客户流失模型为例
智能反欺诈概述
反欺诈手法
机器学习方法
深度学习方法
深度学习模型实作与比较: 以信用卡盗刷预测模型为例
第四天
以利润最大化为目标之产品营销模型的建置
利用集成学习建置小额信贷及信用风险预测模型
——
传统模型评估方法与利润最大化评估方法
增益图与利润图
利润最大化模型实作与比较: 以产品营销模型为例
传统学习与集成学习
集成学习的分类:模型融合与机器学习元算法
模型融合模型建置(多数法(Max Voting)、平均法(Averaging)、
加权平均法(Weighted Averaging)、堆叠法(Stacking)、混合法(Blending))
机器学习元算法模型建置(袋装法(Bagging)、袋装通用法(Bagging meta-estimator)、随机森林(Random Forest)、
提升法(Boosting)、Adaboosting算法、Gradient Boosting算法、XGBoosting算法)
集成学习方法实作与比较: 以小额信贷及信用风险预测模型为例
报名流程:
1,点击对应课程报名链接,在线提交报名信息;
2,参加情况确认,订单缴费(支持支付宝/微信/公务卡银联);
3,提交发票信息,发送电子版开课通知;
4,开课前一周发送交通指南及课程资料,上课事宜。
联系方式:
李老师
QQ:196856791
Tel:010-68478566