楼主: 滨滨有利123
571 0

手把手之stacking|分享集成模型在实际工作中的应用(下) [推广有奖]

  • 0关注
  • 31粉丝

副教授

24%

还不是VIP/贵宾

-

威望
0
论坛币
198 个
通用积分
25.4545
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
9596 点
帖子
328
精华
0
在线时间
383 小时
注册时间
2015-4-26
最后登录
2024-7-21

楼主
滨滨有利123 发表于 2021-8-19 22:57:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

昨天,我们给大家分享了集成模型stacing算法相关内容的(上),今天我们再给大家分享(下)的部分:

本次总体内容,分享大纲如下:

Part1. stacking的原理及框架结构

Part2. stacking在实际工作中的使用分享

Part3. 实操演示搭建stacking框架

Part4. Stacking效果展示

好了,废话不多说,今天我们来手撕Stacking算法。

Part3. 实操演示搭建stacking框架

实操的数据来自某项目现金贷数据集,我们预先做了清洗和处理。搭建的stacking有两层,第一层用各种集成算法来构建基模型,第二层用LR。

代码的运行过程(python):

1.导入各种算法包和数据

2.划分训练集和测试集


3.设定每个基模型的训练参数,这里的算法用到了xgboost,lightgbm,随机森林,极端随机树,catboost,adaboost,GBDT这7种算法。由于这些都是树模型,参数类似,所以每个算法的之间的参数值要体现差异性。


4.搭建第一层stacking的框架,这里采用K折交叉验证,每个基模型预测的结果都转换成模型分。

5.第一层stacking训练,生成新的训练集和测试集


6.第二层stacking训练,用LR做模型融合。并对新测试集做预测


Part4. Stacking效果展示

stacking模型与单模型的效果对比,我们拿算法性能不错的catboost进行比较,用KS作为评估指标,可以看到单模型catboost 测试集KS为0.372,stacking模型的KS为0.396,相比单模型提升了0.024 的KS。


本文中所涉及实操代码与数据集是本周,星球打榜赛的作业,各位要练手的同学请到知识星球平台查收本次内容,本周我们将会公布答案,具体请看:

本次集成模型完整内容请看:


~原创文章

...

end


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:stack King 实际工作 ING 手把手 风控大数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-30 13:43