用普通的分层等比例抽样方法各抽70%样本训练模型,逻辑回归的结果如下:
可见标黄的两组客户分组不均匀(相比10%的客户占比,一组较大,一组较小)。
想咨询两个问题:
1.对于非平衡数据集,一般如何构造训练集能是模型效果较好?(试过睡眠、非睡眠客户各取5000个样本建模,效果不佳)
2.对于模型验证时如图所示的分组不均匀情况,造成的可能原因是什么?如何优化模型?
楼主: 当年孟皓
|
3243
2
[问答] 非平衡数据集LOGISTIC回归模型效果如何调优 |
本科生 18%
-
|
| ||
| ||
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明