CDA Python机器学习周末集训营【Level Ⅲ】,为想希望从事数据挖掘、机器学习工程师相关岗位的人员或者希望通过CDA三级认证考试人员开设。课程设计循序渐进,从基础工具与理论知识入门,进阶机器学习模型、文本挖掘模型,以实战项目案例贯穿课程讲解。其中包括:Python编程基础、数据清洗、数据处理与特征工程、Python机器学习、自然语言处理等课程模块。课程理论知识涵盖CDA LEVEL III等级考试的所有考点,有利于对应等级考试的学员备考。
学习目标
- 熟练掌握数据科学领域最受欢迎的编程语言-Python
- 掌握使用Python和pandas库进行数据清洗和预处理
- 学会使用matplotlib、seaborn进行初级可视化
- 学会使用Pyecharts进行高级数据可视化
- 学会构建机器学习算法进行分类、预测和聚类模型
- 善用机器学习解决用户画像、精准营销、风险管理等商业问题
学习对象和基础
- 机器学习零基础学员
- 高校在校生
- 待业、期待转行从事数据挖掘相关岗位的在职人员
- CDA数据分析师level Ⅲ 考生。
- 希望借助数据挖掘算法来提升解决企业运营、产品运营中涉及的预测问题者
- 对数据挖掘技术感兴趣的各界人士
- 产品、运营、营销、管理、咨询相关岗位从业者,希望增加数据挖掘技能与思维
课程内容
预习课(录播)——数据库SQL
- 数据库基本概念
- DDL数据定义语言
- DML数据操作语言
- 单表查询
- 多表查询
- Python连接SQL
2章预习课(录播)——Python编程基础
- Python标准数据类型
- 控制流语句
- 自定义函数
- 异常和错误
- 类与面向对象编程
- Numpy数组操作
- Pandas数据表基础,数据清洗与探索
- Python可视化包Matplotlib,Seaborn
3章预习课(录播)——数学与统计学基础
- 线性代数
- 微积分
- 描述性统计
- 参数估计
- 假设检验
- 相关分析
- 卡方分析
- 一元线性回归理论推导
- 多元线性回归理论推导
3章机器学习进阶第1周
- 数据接入(接入策略,调度工具,实时数据接入方法)(附加内容)
- 大数据平台技术架构与应用(分布式存储与计算,支持数据分析,大数据架构)(附加内容)
- 数据挖掘导论
- KNN
- 贝叶
4章机器学习进阶第2周
- 带正则项的回归分析
- 支持向量机(SVM)
- 决策树(ID3, C4.5, CART)
- 决策树的模型调优
- 生存分析-病马死亡预测案例
- 用户分类-保险行业用户分类分析
5章机器学习进阶第3周
- 集成与提升方法(AdaBoost, 随机森林, GBDT, XGBoost, LightGBM)
- 聚类分析进阶(密度聚类,谱聚类)
- 异常识别(孤立森林,局部异常因子)
- 交易反欺诈-异常交易识别案例
6章机器学习进阶第4周
- 关联规则(关联规则的概念,评估指标,Apriori算法)
- 协同过滤
- 产品组合策略-电信公司产品捆绑销售策略分析案例
- 数据处理的前沿方法:特征工程概要
- 特征工程(特征的建构、选择、转换、学习)
- 深度神经网络(BP神经网络概述,架构)
- 感知机及感知机的极限
7章机器学习进阶第5周
- 文本分析(分词与词性标注,文本特征处理,关键词抽取、文本分类与聚类方法)
- 文本与用户情绪分析-新闻文本分析案例
8章机器学习进阶第6周
- 径向基网络
- 卷积神经网络
- 循环神经网络
- 图像分析-手写数字自动识别
- 自然语言处理-用户情绪自动识别
- 实战项目-金融行业反欺诈
9章机器学习进阶第7周
- 实战项目-行业文本分析
- 实战项目-信用评分卡
10章CDA认证考试辅导(仅限报名考试的学生)
- 数据挖掘概论
- 高级数据处理与特征工程
- 自然语言处理与文本分析
- 机器学习算法
- 机器学习进阶(自动机器学习,样本不平衡问题,半监督学习,模型优化)
11章选修课
- 互联网数字化运营【18课时】
- 何为数据产品经理?【1课时】
- Python爬虫【15课时】
- Python办公自动化【10课时】
- 人工智能(深度学习)实战之图像识别【6课时】
- 采销、物流与供应链数据分析应用实战【10课时】 (需额外付费)
课程试听:《CDA Python机器学习周末集训营【Level Ⅲ】》
DA内容精选