课程简介
引领数智赋能,精通模型应用
在数字经济时代,利用数字化知识可以使企业摆脱单一供给,并深度挖掘用户需求,探索多元的业务场景。本课程将会从企业的角度出发讲解不同阶段数据应用的建设思路,培养学员掌握企业需要的敏捷算法建模能力,并规划未来发展的路线图。 同时,从找出问题→确定问题→数据清洗→数据建模→数据验证到挖掘出有价值的数据分析思路,并确认适合企业的解决方案。让学员掌握可落地、易操作的数据科学思维和技术模板构建出优秀模型。
涵盖常用工具,完善技术精进
课程中涵盖了Sklearn、LightGBM、NLP、PyTorch、Transformer等常用工具的应用实现,并根据输出的结果分析业务需求,为进行合理、有效的策略优化提供数据支撑。 在课程学习中以问题为导向,加强知识点的理解和应用,提高学员面对复杂问题的思考能力。聚焦策略分析技术及企业常用的分类、NLP、深度学习、特征工程等数据算法,只教实用干货,以专精技术能力提升业务效果与效率。
玩转案例实战,直通企业就业
课程涉及大量企业项目案例:精准营销预测、营销策略优化、客户行为分析、风险管理、客户管理、智能推荐、情感分析、反欺诈等,加持实战经验,为学员进入名企提供项目背书。 对数据科学岗位认知程度比较浅的学员,可在职业规划团队老师的帮助下选择适合学员的职业发展路线。进一步从职场综合能力要求出发,通过经验赋能快速提升岗位匹配度。
cda课程试听
https://edu.cda.cn/goods/show/2586
课程报名
https://www.cda.cn/kecheng/218.html
目标人群
在职提升人群
算法建模少 想获得最优策略算法的人员
工作经验少 想提升数据挖掘技能的人员
业余时间多 想提高数据思维能力的人员
转行数据分析人群
自学难度大 想零基础快速入门的人员
升职加薪难 想要跳槽大幅涨薪的人员
行业不景气 想进新兴数据行业的人员
在职提升和转岗人群
工作任务重 想提高工作效率的财务、市场等人员
竞争压力大 想突破职业瓶颈的产品、运营等人员
行业挑战多 想提升战略思维的决策、管理等人员
CDA报考人群
报名参加 CDA Level I 等级考试的考生
报名参加 CDA Level ll 等级考试的考生
报名参加 CDA Level llI 等级考试的考生
课程案例
案例一:金融行业——信用卡人群用户画像
利用sql语言对数据进行加工处理,标签化,并依据标签情况,利用python进行用户画像绘制。
案例二:电商行业——淘宝用户行为分析
通过对淘宝用户行为相关数据进行分析,帮助商家监控目前数据趋势,分析并改善转化链路,助力业务侧方向提升。
案例三:快消品行业——快时尚行业线上零售数据分析
使用某电商真实用户交易数据,在用户生命周期中,运用分析方法论分析不同用户的行为特征、价值贡献等。
案例四:社会经济发展研究——地区经济发展水平研究
在这份研究需求中,我们希望了解哪些地区更相似,因为相似的地区适宜进行对标,同时我们也关注各个地区是否能按照发展水平划分不同的类型
案例五:金融行业——挖掘产品订购的关联关系交叉销售
对于银行统计的客户订购产品的订单,进行产品订购的关联挖掘,达到发现客户多种需求,维护客户关系管理的数据策略
案例六:新媒体行业——新浪新闻分类案例
使用新闻数据,利用文本分析技术对新闻文本进行特征加工等相关工作,并训练分类模型,实现文本的自动分类。
案例七:深度学习NLP——中文问答机器人
给定一个足够大的语料库,以深度学习NLP算法训练一个机器人。当传入一个问题时,算法可以自动从该语料库中找到答案。
章节名称 | 主要内容 | 核心能力 |
---|---|---|
第一章:课前基础-数据库 SQL | 1、数据库基本概念 2、DDL 3、DML 4、单表查询 5、多表查询 6、常用函数 6、SQL 大厂面试题 |
1、掌握 MySQL 数据库基本概念,常用函数、DDL 数据定义语言及 DML 数据操作语言 2、掌握单表查询、多表查询查询方法,查询结果排序、限制查询等方法 |
第二章:课前基础-Python | 1、Numpy 数组 2、Pandas 数表 3、Pandas 数据清洗与可视化 4、控制流 5、类与对象 6、自定义函数 |
掌握使用 Python 进行海量数据清洗以及可视化探索数据的能力。 |
第三章:课前基础-数学统计基础 | 1、线性代数 2、微积分 3、描述性统计 4、参数估计 5、假设检验 6、相关分析 7、一元线性回归 |
1、掌握数学基础知识(线性代数、微积分等) 2、掌握统计学基础知识(描述性统计、参数估计、相关分析、卡方分析、一元线性回归等) |
第四章:SQL | 1、MySQL 语句 2、Python 连接 SQL 数据库 3、SQL 4、实操案例:零售电商多表分析 |
1、掌握数据库 MySQL 语句与实战 2、Python 连接 SQL 数据库 3、掌握案例:零售电商多表分析 |
第五章:指标体系+统计分析 | 1、分析基础 2、指标体系的意义与构建 3、常用指标体系 4、统计分析可视化 5、指标体系 |
1、掌握数据分析基础:数据分析的概念、过程、能力 2、掌握常用指标体系的意义与构建 3、掌握统计分析可视化 4、掌握指标体系案例:企业经营分析 |
第六章:Pandas | 1、Python 基础 2、Python 数据清洗可视化 3、Python 实操 4、案例:教育行业分析-学校学科教育可视化 数据分析师岗位需求-lagou 数据处理及分析 |
1、掌握 Python 基础与数据清洗可视化 2、掌握 Python 实操案例:教育行业分析-学校学科教育可视化 3、掌握 Python 实操案例: 数据分析师岗位需求-lagou数据处理及分析 |
第七章:方差分析与线性回归 | 1、统计分析 2、相关分析 3、方差分析 4、线性回归 5、模型建立 6、模型估计 7、模型检验 8、实操案例:识别分析-用户支出影响因素分析 |
1、掌握统计分析,包含相关分析,方差分析等 2、掌握线性回归,包含模型的建立与估计等 3、掌握统计模型的检验 4、掌握案例:识别分析-用户支出影响因素分析 |
第八章:逻辑回归与主成分分析 | 1、逻辑回归 2、模型评估 3、分类与回归的结合 4、数据降维 5、主成分分析 6、因子分析 7、实操案例:用户流失分析-员工流失预警 因子分析-城市发展水平综合分析 |
1、掌握逻辑回归,包含模型的建立与估计 2、掌握模型评估、分类与回归的结合 3、掌握信息压缩-主成分分析与因子分析(数据降维) 4、掌握案例:用户流失分析-员工流失预警 5、掌握案例:因子分析-城市发展水平综合分析 |
第九章:标签体系与用户画像 | 1、标签体系的设计原理 2、用户标签的制作方法 3、客群分析-标签体系与用户画像 4、AB test 5、实操案例: 应用用户画像-美国某企业用户画像实战案例 |
1、掌握标签体系的设计原理 2、掌握用户标签的制作方法 3、掌握客群分析-标签体系与用户画像 4、掌握 AB test 应用最广泛的对比分析方法 5、掌握案例:应用用户画像-美国某企业用户画像实战案例 |
第十章:时间序列 | 1、时间序列分析 2、ARIMA算法 3、Box-Jenkins 建模 4、时间序列回归 5、实操案例: 销售额预测-线上平台销售额预测实战案例 |
1、掌握时间序列分析(ARIMA 算法) 2、掌握 Box-Jenkins 建模流程 3、掌握时间序列回归 4、掌握案例:销售额预测-线上平台销售额预测实战案例 |
第十一章:数据处理与特征工程 | 1、数据采集 2、数据录入 3、数据清洗 4、特征工程基础 5、特征预处理 6、特征的选择转换 7、数据管理 8、数据分类 9、数据建模 10、实操案例: 产品目标人群分析-市场数据的应用案例 |
1、掌握数据采集处理方法,包含数据采集、数据录入、数据清洗 2、掌握特征工程基础,包含特征预处理、特征的选择与转换 3、掌握数据管理,包含数据分类、数据建模 4、掌握案例:产品目标人群分析-市场数据的应用案例 |
第十二章:聚类分析与决策树 | 1、层次聚类 2、Kmeans 聚类 3、决策树应用 4、聚类分析评价方法 5、实操案例: 用户分群-零售行业运营案例 |
1、掌握层次聚类知识 2、掌握 Kmeans 聚类知识 3、掌握聚类分析评价方法-决策树应用 4、掌握案例:用户分群-零售行业运营案例 |
第十三章:数字化工作方法 | 1、数字化工作方法 2、运筹优化方法 3、线性规划与二次优化 4、基于业务流程的优化 5、实操案例: 数字化运营综合案例-某机构营销响应概率预测与风险预测案例 |
1、掌握数字化工作方法 2、掌握运筹优化方法,包含线性规划与二次优化、基于业务流程的优化 3、掌握数字化运营综合案例-某机构营销响应概率预测与风险预测案例 |
第十四章:ETL 与数仓 | 1、ETL 基本概念与常用工具 2、Kettle 核心概念与配置 3、数据接入策略与调度 4、Kettle 转换 5、Kettle 作业 6、Kettle 连接数仓 7、ETL 实战项目 |
1、掌握 ETL 基本概念与常用工具 2、掌握 Kettle 核心概念、转换 3、掌握 ETL 连接数仓,实操 ETL 实战项目 |
第十五章:数据接入与大数据 | 1、分布式存储 2、PySpark 分布式计算 3、Spark 与 Flink 工作原理 4、Spark 基本语法 |
1、掌握分布式存储与计算 2、掌握 Spark 与 Flink 工作原理 3、掌握 Spark 基本语法 4、掌握使用 PySpark 实现分布式计算 |
第十六章:决策树 | 1、决策树 2、信息熵 3、ID3决策树 4、C4.5决策树 5、CART树 6、模型调参 7、实操案例:病马死亡归类与识别案例 用户分类-保险行业用户分类分析 |
1、掌握决策树与信息熵 2、掌握 ID3, C4.5, CART 树 3、掌握 模型调参:网格搜索 4、掌握案例:病马死亡归类与识别案例 5、掌握案例:用户分类-保险行业用户分类分析 |
第十七章:数据挖掘与 Pipeline | 1、数据挖掘导论 2、KNN 3、朴素贝叶斯 4、Pipeline 工作流 5、使用 Pipeline 提交算法模型 |
1、掌握数据挖掘导论 2、掌握 KNN 邻近算法 3、掌握朴素贝叶斯法 4、掌握 Pipeline 工作流 5、使用 Pipeline 提交算法模型 |
第十八章:正则回归、SVM | 1、带正则项的回归分析 2、SVM 3、MLOps 基本概念 4、MLFlow 实战 MLOps 5、大数据环境下的回归分析实现 |
1、掌握带正则项的回归分析 2、掌握大数据环境下的回归分析实现(用 Spark 实现) 3、掌握 SVM 支持向量机 4、掌握 MLOps 基本概念 5、掌握 MLFlow 实战 MLOps |
第十九章:关联规则与协同过滤 | 1、关联规则 2、评估指标 3、Apriori 算法 4、协同过滤 5、大数据环境下的协同过滤实现 6、实操案例:产品组合策略-电信公司产品捆绑销售策略分析案例 |
1、掌握关联规则,包含关联规则的概念、评估指标、Apriori 算法等 2、掌握协同过滤 3、掌握大数据环境下的协同过滤实现 4、掌握产品组合策略案例-电信公司产品捆绑销售策略分析案例 |
第二十章:集成与提升方法 | 1、集成学习理论基础 2、AdaBoost 3、随机森林及其 Spark 实现 4、GBDT 5、XGBoost 6、LightGBM 7、CatBoost 8、NGBoost |
1、掌握集成学习的理论基础 2、掌握 AdaBoost 3、掌握随机森林及其 Spark 实现 4、掌握 GBDT, XGBoost 5、掌握 LightGBM, CatBoost, NGBoost |
第二十一章:特征工程进阶 | 1、数据不平衡问题 2、特征的构造与学习 3、模型可解释性专题(SHAP 和 LIME) 4、感知器 5、多层感知器 |
1、掌握掌握数据不平衡问题相关知识 2、掌握特征工程进阶:特征的构造与学习 3、掌握模型可解释性专题(SHAP 和 LIME) 4、掌握感知器及多层感知器 |
第二十二章:深度学习基础 | 1、深度神经网络基础 BP 神经网络架构 2、反向传播算法 3、梯度与学习率专题 4、图像分析-手写数字自动识别 |
1、掌握深度神经网络基础 2、掌握 BP 神经网络架构 3、掌握反向传播算法 4、掌握梯度与学习率专题 5、掌握图像分析-手写数字自动识别 |