楼主: xulimei1986
7592 17

[问答] 如何提高logistics回归模型的命中率 [推广有奖]

11
ziyenano 发表于 2012-10-18 16:19:19 |只看作者 |坛友微信交流群
xulimei1986 发表于 2012-10-18 16:01
正在尝试用非参数判别,流失比例只有所有样本的1%左右!
需要过度抽样,然后建模,否则不能充分提取流失的特征

使用道具

12
xulimei1986 发表于 2012-10-18 17:08:22 |只看作者 |坛友微信交流群
ziyenano 发表于 2012-10-18 16:19
需要过度抽样,然后建模,否则不能充分提取流失的特征
如果是1百万的数据样本,先抽10%做为训练样本,其中训练样本中流失与未流失的比例为3:1,这样不需要过度抽样也可以训练模型。
家家有本难念的经,计较的少一点,会和睦许多!!

使用道具

13
ziyenano 发表于 2012-10-18 18:35:23 |只看作者 |坛友微信交流群
xulimei1986 发表于 2012-10-18 17:08
如果是1百万的数据样本,先抽10%做为训练样本,其中训练样本中流失与未流失的比例为3:1,这样不需要过度 ...
这样做,不就是过度抽样嘛

使用道具

14
梦之殇 发表于 2012-10-19 12:09:28 |只看作者 |坛友微信交流群
ziyenano 发表于 2012-10-18 18:35
这样做,不就是过度抽样嘛
请问下原始1%的流失率,取什么样的流失与未流失比例建模是比较科学的?
我在论文里看是按3:1或4:1,但不知道原始的流失率是什么样的。
自从我开始签到,我又长了8厘米,OMG!

使用道具

15
ziyenano 发表于 2012-10-19 12:18:07 |只看作者 |坛友微信交流群
梦之殇 发表于 2012-10-19 12:09
请问下原始1%的流失率,取什么样的流失与未流失比例建模是比较科学的?
我在论文里看是按3:1或4:1,但 ...
其实没有准确的一个标准,只要比率不是太低就行,计算出的概率也是相对的,最终总是将概率的高的用户判别为流失用户。
已有 1 人评分热心指数 信用等级 收起 理由
梦之殇 + 1 + 1 谢谢

总评分: 热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

16
xxxuuulll 发表于 2012-12-24 16:49:29 |只看作者 |坛友微信交流群
梦之殇 发表于 2012-10-19 12:09
请问下原始1%的流失率,取什么样的流失与未流失比例建模是比较科学的?
我在论文里看是按3:1或4:1,但 ...
请问有相关方面的资料可以参考学习么?

使用道具

17
wodematlab 发表于 2012-12-24 21:53:04 |只看作者 |坛友微信交流群
xulimei1986 发表于 2012-10-18 16:01
正在尝试用非参数判别,流失比例只有所有样本的1%左右!
可能流失率太低。能否加大流失率的比例,这样建模

使用道具

18
C100 发表于 2015-6-3 14:37:40 |只看作者 |坛友微信交流群
楼主,你的预警流失做得怎么样了?我现在也遇到了同样的问题!!!求助啊啊啊

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-6 15:22