用普通的分层等比例抽样方法各抽70%样本训练模型,逻辑回归的结果如下:
可见标黄的两组客户分组不均匀(相比10%的客户占比,一组较大,一组较小)。
想咨询两个问题:
1.对于非平衡数据集,一般如何构造训练集能是模型效果较好?(试过睡眠、非睡眠客户各取5000个样本建模,效果不佳)
2.对于模型验证时如图所示的分组不均匀情况,造成的可能原因是什么?如何优化模型?

|
楼主: 当年孟皓
|
3660
2
[问答] 非平衡数据集LOGISTIC回归模型效果如何调优 |
|
本科生 19%
-
|
| ||
|
|
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


