楼主: peylinn8
453 2

[学习笔记] 【学习笔记】2019/12/09 《No.8: p66-p75》《增强型分析-AI驱动的数据分析、业 ... [推广有奖]

  • 0关注
  • 6粉丝

副教授

4%

还不是VIP/贵宾

-

威望
0
论坛币
3852 个
通用积分
378.7263
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2958 点
帖子
532
精华
0
在线时间
3 小时
注册时间
2017-3-31
最后登录
2023-10-31

楼主
peylinn8 发表于 2019-12-9 23:23:07 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
2019/12/09
《No.8: p66-p75》《增强型分析-AI驱动的数据分析、业务决策与案例实践》读书笔记
第3章 预测模型的新技术

3.6 让模型在训练结束后还能被更新

  模型训练后还可更新的技术: 热启动(Warm start)、增量学习(Incremental Learning)
3.6.1 热启动
   1.定义: 建模过程中,不是从零开始,而是利用之前的模型结果作为本次建模的初始值。
   2.多用于「回归类」算法、「决策树」类算法、「集成学习算法」。
3.6.2 增量学习
   1.定义: 可以持续不断地读取训练数据,进而不断更新模型的机器学习算法。
   2.优点: 节省空间;训练时间短。
   3.常用于大规模数据或流式数据
   4.有时增量学习又称为「在线(on-line)学习」
   5.增量学习与机器学习,算法不同,设计算法时就要以「小批量(mini-batch)」方式进行。
   6.scikit-learn算法库支持增量学习的算法,包括「朴素贝叶斯」、「SGD分类算法」、「小批量Kmeans
」、「增量PCA」等。

3.7 多输出预测
   定义: 预测模型的输出多于一个目标值时。
3.7.1 Binary Relevance
   定义: 用同一个自变量x来预测每一个Y列。scikit-learn算法库提供了MultiOutputClassifier可实现此功能。

3.7.2 Classifier Chain
   1.Binary Relevance: 并行进行模型预测,目标值之间没有关系;Classifier Chain,则是串行进行预测,目标值之间可能存在关系。
   2.Classifier Chain,目标值之间有关系,前一个目标值会是下一个目标值的输入项,这样可提升预测精度。(这是Classifier Chain最重要的特点)
   3. scikit-learn算法库提供了Classifier Chain工具可实现此功能。
   4.缺点: 若前一目标值有错误,会造成”错误传播”,而影响预测效果。

3.7.3 Ensemble Classifier Chain
   1.Ensemble Classifier Chain的实现过程是随机生成多个Chain,然后再分别进行训练而预测结果是通过”软投票”来决定。这可已解决”错误传播”的问题。

3.8 如何给客户从数百个产品中找到合适的产品
3.8.1 问题提出: 如,是否构建很多产品的响应模型;如何确定营销时机;如何定价;如何满足预算与收益;如何评估效果;如何量化客户体验等。
3.8.2 建模思路
   客户需求分析:
      1)表现在行为上: 客户行为序列的分析  
      2)表现在行为的结果上: 产品响应预测产生推荐
3.8.3 模型训练与运用
   作者用银行理财客户的数据,展示了简单的产品响应建模过程,调用Multioutput-multiclass的相关组件来建模,采用Binary Relevance方法来实现多目标的预测。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习笔记 数据分析 习笔记 增强型 scikit-learn

沙发
512661101 发表于 2019-12-27 12:52:35 来自手机

藤椅
jessie68us 发表于 2020-1-27 14:30:23 来自手机

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 13:38