楼主: 当年孟皓
3243 2

[问答] 非平衡数据集LOGISTIC回归模型效果如何调优 [推广有奖]

  • 1关注
  • 0粉丝

本科生

18%

还不是VIP/贵宾

-

威望
0
论坛币
376 个
通用积分
50.3000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
115 点
帖子
10
精华
0
在线时间
141 小时
注册时间
2014-5-5
最后登录
2024-4-18

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近要对活跃信用卡交易客户预测以后睡眠的概率,数据集是非平衡数据集(睡眠客户只占比7%)。
用普通的分层等比例抽样方法各抽70%样本训练模型,逻辑回归的结果如下:
模型结果概率分布不均匀.png
可见标黄的两组客户分组不均匀(相比10%的客户占比,一组较大,一组较小)。

想咨询两个问题:
1.对于非平衡数据集,一般如何构造训练集能是模型效果较好?(试过睡眠、非睡眠客户各取5000个样本建模,效果不佳)
2.对于模型验证时如图所示的分组不均匀情况,造成的可能原因是什么?如何优化模型?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Logistic回归模型 logistic回归 logistic ogistic logisti 信用卡 模型 平衡 如何 样本

沙发
ryuuzt 发表于 2016-12-15 08:32:47 |只看作者 |坛友微信交流群
是否可以使用PSM方法匹配,然后进行回顾。再用回顾的结果记分,再次进行psm匹配。直到结果没有太大的改进为止。不知道是否可行。你如果有什么好的结果,请告诉我一下,非常感谢!

使用道具

藤椅
当年孟皓 发表于 2016-12-15 13:05:45 |只看作者 |坛友微信交流群
ryuuzt 发表于 2016-12-15 08:32
是否可以使用PSM方法匹配,然后进行回顾。再用回顾的结果记分,再次进行psm匹配。直到结果没有太大的改进为 ...
PSM方法是什么?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 01:51