楼主: xulimei1986
7566 17

[问答] 如何提高logistics回归模型的命中率 [推广有奖]

  • 3关注
  • 0粉丝

博士生

68%

还不是VIP/贵宾

-

威望
0
论坛币
41 个
通用积分
0
学术水平
3 点
热心指数
8 点
信用等级
3 点
经验
22590 点
帖子
138
精华
0
在线时间
439 小时
注册时间
2012-3-20
最后登录
2019-5-11

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
采用不同时段的数据训练模型,模型效果变化较大,且模型命中率均不高,有什么好的解决方式?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:LOGISTICS logistic logisti ogistic logist 如何 效果 logistics 命中率 模型

回帖推荐

ziyenano 发表于8楼  查看完整内容

个人几个建议: 1.筛选变量,logistic用逐步回归法筛选,估计楼主已经做了; 能不能增加一些解释变量,再重新筛选变量,模型的好坏很大程度取决解释变量的选取。 2.决策树的一些算法,看是否出现了过度拟合,而导致模型的推广能力不足,出现训练模型不错,测试样本预测很糟糕的情况,如果这样,建议增加分支节点的最小记录数,或者全局修剪决策树,防止过度拟合的发生。 3.楼主说到流失,我不知道是不是流失率很低的模型,如 ...

本帖被以下文库推荐

沙发
davil2000 发表于 2012-10-17 11:30:50 |只看作者 |坛友微信交流群
因果关系不显著  实验模型需要重设计
R是万能的,SAS是不可战胜的!

使用道具

藤椅
xulimei1986 发表于 2012-10-17 11:41:46 |只看作者 |坛友微信交流群
davil2000 发表于 2012-10-17 11:30
因果关系不显著  实验模型需要重设计
怎么可能呢,不然也不会选择这个模型来做用户流失预警了

使用道具

板凳
davil2000 发表于 2012-10-17 12:20:33 |只看作者 |坛友微信交流群
xulimei1986 发表于 2012-10-17 11:41
怎么可能呢,不然也不会选择这个模型来做用户流失预警了
分析结果稳健吗?
R是万能的,SAS是不可战胜的!

使用道具

报纸
xulimei1986 发表于 2012-10-17 12:24:33 |只看作者 |坛友微信交流群
davil2000 发表于 2012-10-17 12:20
分析结果稳健吗?
就是模型不太稳健,用决策树也做了,效果差不多,现在是从回归模型本身来讲,是否可以调节一些参数,增强其稳健性?
家家有本难念的经,计较的少一点,会和睦许多!!

使用道具

地板
ziyenano 发表于 2012-10-17 13:02:00 |只看作者 |坛友微信交流群
数据量大不大?小样本的话,可以试试SVM(支持向量机),模型比较稳健,
也可以试试非参数的方法,就是结果不易于解释。

使用道具

7
xulimei1986 发表于 2012-10-17 13:18:08 |只看作者 |坛友微信交流群
ziyenano 发表于 2012-10-17 13:02
数据量大不大?小样本的话,可以试试SVM(支持向量机),模型比较稳健,
也可以试试非参数的方法,就是结果不 ...
样本很大,都是几个G的数据
家家有本难念的经,计较的少一点,会和睦许多!!

使用道具

8
ziyenano 发表于 2012-10-17 13:36:05 |只看作者 |坛友微信交流群
xulimei1986 发表于 2012-10-17 13:18
样本很大,都是几个G的数据
个人几个建议:
1.筛选变量,logistic用逐步回归法筛选,估计楼主已经做了;
能不能增加一些解释变量,再重新筛选变量,模型的好坏很大程度取决解释变量的选取。
2.决策树的一些算法,看是否出现了过度拟合,而导致模型的推广能力不足,出现训练模型不错,测试样本预测很糟糕的情况,如果这样,建议增加分支节点的最小记录数,或者全局修剪决策树,防止过度拟合的发生。
3.楼主说到流失,我不知道是不是流失率很低的模型,如果是这样,应该采取过度抽样的方法,即人为加大流失在样本中的比率,从而能够提取流失的特征,而判别模型的好坏,也非传统意义上的“预测准确率”,通常通过提升图,增益图一些方法来判别。
4.如果以上方法都行不通,试试从技术上解决,试试 proc gam拟合非参数的logistic,或者proc discrimi 试试非参数判别,不过不清楚这两个过程处理大数据量的效率。
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

使用道具

9
ziyenano 发表于 2012-10-18 14:16:02 |只看作者 |坛友微信交流群
回个帖,也要审核半天,晕死

使用道具

10
xulimei1986 发表于 2012-10-18 16:01:51 |只看作者 |坛友微信交流群
ziyenano 发表于 2012-10-17 13:36
个人几个建议:
1.筛选变量,logistic用逐步回归法筛选,估计楼主已经做了;
能不能增加一些解释变量, ...
正在尝试用非参数判别,流失比例只有所有样本的1%左右!
家家有本难念的经,计较的少一点,会和睦许多!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 21:41