签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › SAS专版 › 如何提高logistics回归模型的命中率

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

提升主题| 本版置顶| 关闭主题| 变更主题颜色| 抢沙发| 顶贴| 显身卡| 道具中心

楼主: xulimei1986

7566 17

[问答] 如何提高logistics回归模型的命中率 [推广有奖]

3关注
0粉丝

博士生

68%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 41 个
通用积分: 0
学术水平: 3 点
热心指数: 8 点
信用等级: 3 点
经验: 22590 点
帖子: 138
精华: 0
在线时间: 439 小时
注册时间: 2012-3-20
最后登录: 2019-5-11

楼主

xulimei1986 发表于 2012-10-17 10:03:09 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

采用不同时段的数据训练模型，模型效果变化较大，且模型命中率均不高，有什么好的解决方式？

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：LOGISTICS logistic logisti ogistic logist 如何效果 logistics 命中率模型

相关帖子

回帖推荐

ziyenano 发表于8楼查看完整内容

个人几个建议： 1.筛选变量，logistic用逐步回归法筛选，估计楼主已经做了；能不能增加一些解释变量，再重新筛选变量，模型的好坏很大程度取决解释变量的选取。 2.决策树的一些算法，看是否出现了过度拟合，而导致模型的推广能力不足，出现训练模型不错，测试样本预测很糟糕的情况，如果这样，建议增加分支节点的最小记录数，或者全局修剪决策树，防止过度拟合的发生。 3.楼主说到流失，我不知道是不是流失率很低的模型，如 ...

本帖被以下文库推荐

· SAS精彩问答|主题: 2530, 订阅: 30

回复

使用道具举报

沙发

davil2000 发表于 2012-10-17 11:30:50 |只看作者 |坛友微信交流群

因果关系不显著实验模型需要重设计

R是万能的，SAS是不可战胜的！

回复

使用道具举报

藤椅

xulimei1986 发表于 2012-10-17 11:41:46 |只看作者 |坛友微信交流群

davil2000 发表于 2012-10-17 11:30
因果关系不显著实验模型需要重设计

怎么可能呢，不然也不会选择这个模型来做用户流失预警了

回复

使用道具举报

板凳

davil2000 发表于 2012-10-17 12:20:33 |只看作者 |坛友微信交流群

xulimei1986 发表于 2012-10-17 11:41
怎么可能呢，不然也不会选择这个模型来做用户流失预警了

分析结果稳健吗？

R是万能的，SAS是不可战胜的！

回复

使用道具举报

报纸

xulimei1986 发表于 2012-10-17 12:24:33 |只看作者 |坛友微信交流群

davil2000 发表于 2012-10-17 12:20
分析结果稳健吗？

就是模型不太稳健，用决策树也做了，效果差不多，现在是从回归模型本身来讲，是否可以调节一些参数，增强其稳健性？

家家有本难念的经，计较的少一点，会和睦许多！！

回复

使用道具举报

地板

ziyenano 发表于 2012-10-17 13:02:00 |只看作者 |坛友微信交流群

数据量大不大？小样本的话，可以试试SVM(支持向量机)，模型比较稳健，
也可以试试非参数的方法，就是结果不易于解释。

回复

使用道具举报

7楼

xulimei1986 发表于 2012-10-17 13:18:08 |只看作者 |坛友微信交流群

ziyenano 发表于 2012-10-17 13:02
数据量大不大？小样本的话，可以试试SVM(支持向量机)，模型比较稳健，
也可以试试非参数的方法，就是结果不 ...

样本很大，都是几个G的数据

家家有本难念的经，计较的少一点，会和睦许多！！

回复

使用道具举报

8楼

ziyenano 发表于 2012-10-17 13:36:05 |只看作者 |坛友微信交流群

xulimei1986 发表于 2012-10-17 13:18
样本很大，都是几个G的数据

个人几个建议：
1.筛选变量，logistic用逐步回归法筛选，估计楼主已经做了；
能不能增加一些解释变量，再重新筛选变量，模型的好坏很大程度取决解释变量的选取。
2.决策树的一些算法，看是否出现了过度拟合，而导致模型的推广能力不足，出现训练模型不错，测试样本预测很糟糕的情况，如果这样，建议增加分支节点的最小记录数，或者全局修剪决策树，防止过度拟合的发生。
3.楼主说到流失，我不知道是不是流失率很低的模型，如果是这样，应该采取过度抽样的方法，即人为加大流失在样本中的比率，从而能够提取流失的特征，而判别模型的好坏，也非传统意义上的“预测准确率”，通常通过提升图，增益图一些方法来判别。
4.如果以上方法都行不通，试试从技术上解决，试试 proc gam拟合非参数的logistic，或者proc discrimi 试试非参数判别，不过不清楚这两个过程处理大数据量的效率。

已有 1 人评分	经验	论坛币	收起理由
bakoll	+ 3	+ 3	精彩帖子

总评分: 经验 + 3 论坛币 + 3 查看全部评分

回复

使用道具举报

9楼

ziyenano 发表于 2012-10-18 14:16:02 |只看作者 |坛友微信交流群

回个帖，也要审核半天，晕死

回复

使用道具举报

10楼

xulimei1986 发表于 2012-10-18 16:01:51 |只看作者 |坛友微信交流群

ziyenano 发表于 2012-10-17 13:36
个人几个建议：
1.筛选变量，logistic用逐步回归法筛选，估计楼主已经做了；
能不能增加一些解释变量， ...

正在尝试用非参数判别，流失比例只有所有样本的1%左右！

家家有本难念的经，计较的少一点，会和睦许多！！

回复

使用道具举报

发帖

本版微信群

加好友,备注cda
拉您进交流群

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明