菜菜的机器学习sklearn课堂
http://edu.cda.cn/course/982
十二周,让菜菜带你认识sklearn,带你深入浅出地探索算法的神秘世界。我会为你解读sklearn中的主流算法,带你处理数据,调整参数,完善算法,调用结果。我会为你解析参数,助你理解算法原理,也会带你遍历案例,带你实战给你刷经验。十二周之后,人人都能够三行实现算法,实现少加班,多钻研,在数据行业乘风破浪的目标,为成为优秀的数据挖掘工程师打下坚实的基础~
第1章: 菜菜的机器学习sklearn课程介绍
免费 课时 1 : 课程介绍
课时 2 : 开始学习机器学习之前:配置环境
课时 3 : 全部章节数据
第2章: 决策树
课时 4 : 决策树课件
免费 课时 5 : 1. 引言,sklearn入门
免费 课时 6 : 2. 决策树:概述
免费 课时 7 : 3. 分类树:参数Criterion
课时 8 : 4. 分类树:实现一棵树,随机性参数
课时 9 : 5. 分类树:剪枝参数调优(1)
课时 10 : 5. 分类树:剪枝参数调优(2)
课时 11 : 6. 分类树:重要属性和接口
课时 12 : 7. 回归树:参数,属性和接口
课时 13 : 7. 回归树:交叉验证 (1)
课时 14 : 7. 回归树:交叉验证(2)
课时 15 : 8. 回归树案例:用回归树拟合正弦曲线
课时 16 : 9. 案例:泰坦尼克号生存者预测 (1)
课时 17 : 9. 案例:泰坦尼克号生存者预测 (2)
课时 18 : 9. 案例:泰坦尼克号生存者预测 (3)
课时 19 : 9.案例:泰坦尼克号生存者预测 (4)
第3章: 随机森林
课时 20 : 随机森林课件
课时 21 : 2.0 集成算法概述
课时 22 : 2.1 随机森林分类器 参数n_estimators与建立一片森林
课时 23 : 2.2 参数boostrap & oob_score + 重要属性和接口
课时 24 : 2.3 [选学] 袋装法的另一个必要条件
课时 25 : 3.1 随机森林回归器
课时 26 : 3.2 案例:用随机森林填补缺失值 (1)
课时 27 : 3.3 案例:用随机森林填补缺失值 (2)
课时 28 : 3.4 案例:用随机森林填补缺失值 (3)
课时 29 : 3.5 案例:用随机森林填补缺失值 (4)
课时 30 : 4. 机器学习中调参的基本思想
课时 31 : 5. 案例:随机森林在乳腺癌数据上的调参 (1)
课时 32 : 5. 案例:随机森林在乳腺癌数据上的调参 (2)
第4章: 数据预处理和特征工程
课时 33 : 数据预处理与特征工程课件
课时 34 : 概述 + 12期课纲
课时 35 : 数据预处理1:无量纲化:数据归一化
课时 36 : 数据预处理2:无量纲化:数据标准化
课时 37 : 数据预处理3:缺失值 (1)
课时 38 : 数据预处理4:缺失值 (2)
课时 39 : 数据预处理5:处理分类型数据:编码与哑变量
课时 40 : 数据预处理6:处理连续型数据:二值化和分箱
课时 41 : 特征选择1:过滤法:方差过滤 (1)
课时 42 : 特征选择2:过滤法:方差过滤 (2)
课时 43 : 特征选择3:过滤法:卡方过滤
课时 44 : 特征选择4:过滤法:F检验和互信息法 (1)
课时 45 : 特征选择5:过滤法:互信息法(2) + 总结
课时 46 : 特征选择6:嵌入法 (1)
课时 47 : 特征选择7:嵌入法 (2)
课时 48 : 特征选择8:包装法 + 总结
第5章: 主成分分析PCA与奇异值分解SVD
课时 49 : 降维算法课件
课时 50 : 1 概述
课时 51 : 2.1 降维究竟怎样实现?
课时 52 : 2.2 参数应用案例:高维数据的可视化 (1)
课时 53 : 2.2 参数应用案例:高维数据的可视化 (2)
课时 54 : 2.3 PCA中的SVD,重要参数svd_solver
课时 55 : 2.3 属性应用案例:人脸识别中的components_应用
课时 56 : 2.4 接口应用案例:用人脸识别看PCA降维后的信息保存量
课时 57 : 2.4 接口应用案例:用PCA实现手写数字的噪音过滤
课时 58 : 2.5 总结:原理,流程,重要属性接口和参数
课时 59 : 3 案例:PCA实现784个特征的手写数字的降维 (1)
课时 60 : 3 案例:PCA实现784个特征的手写数字的降维 (2)
第6章: 逻辑回归与评分卡
课时 61 : 逻辑回归课件
课时 62 : 1.0 前言
课时 63 : 1.1 逻辑回归概述:名为“回归”的分类器
课时 64 : 1.2 为什么需要逻辑回归
课时 65 : 1.3 sklearn当中的逻辑回归
课时 66 : 2.1.1 二元逻辑回归的损失函数
课时 67 : 2.2.1 正则化:重要参数penalty & C
课时 68 : 2.2.2 逻辑回归的特征工程 (1)
课时 69 : 2.2.2 逻辑回归的特征工程 (2)
课时 70 : 2.2.2 逻辑回归的特征工程 (3)
课时 71 : 2.2.2 逻辑回归的特征工程 (4)
课时 72 : 2.3.1 重要参数max_iter - 梯度下降求解逻辑回归的过程
课时 73 : 2.3.2 梯度的概念与解惑
课时 74 : 2.3.3 步长的概念与解惑
课时 75 : 2.4 二元回归与多元回归:重要参数solver & multi_class
课时 76 : 2.5 样本不均衡与参数class_weight
课时 77 : 3.1 评分卡案例 - 评分卡与完整的模型开发流程
课时 78 : 3.2.1~2 评分卡 - 数据预处理(1) - 重复值与缺失值
课时 79 : 3.2.3 评分卡 - 数据预处理 (2) - 异常值
课时 80 : 3.2.4 案例:评分卡 - 数据预处理 (3) - 标准化
课时 81 : 3.2.5 案例:评分卡 - 数据预处理 (4) - 样本不均衡问题
课时 82 : 3.2.6 案例:评分卡 - 数据预处理 (5) - 保存训练集和测试集数据
课时 83 : 3.3 案例:评分卡 - 分箱(1) - 概述与概念
课时 84 : 3.3.1 案例:评分卡 - 分箱 (2) - 等频分箱 (1)
课时 85 : 3.3.1 案例:评分卡 - 分箱 (3) - 等频分箱 (2)
课时 86 : 3.3.2 案例:评分卡 - 分箱 (4) - 选学说明
课时 87 : 3.3.3 案例:评分卡 - 分箱 (5) - 计算WOE与IV
课时 88 : 3.3.4 案例:评分卡 - 分箱 (6) - 卡方检验,箱体合并,IV值曲线,确定最优的箱子个数
课时 89 : 3.3.5 案例:评分卡 - 分箱 (7) - 包装分箱函数
课时 90 : 3.3.6 案例:评分卡 - 分箱 (8) - 包装判断分箱个数的函数
课时 91 : 3.3.7 案例:评分卡 - 分箱 (9) - 对所有特征进行分箱
课时 92 : 3.4 案例:评分卡 - 映射数据 (1)
课时 93 : 3.4 案例:评分卡 - 映射数据 (2)
课时 94 : 3.5 案例:评分卡 - 建模与模型验证
11:41
课时 95 : 3.6 案例:评分卡 - 评分卡的输出和建立
16:59