楼主: 望路人
13078 4

[学科前沿] 关于评分卡模型中的证据权重转换问题 [推广有奖]

  • 0关注
  • 0粉丝

本科生

84%

还不是VIP/贵宾

-

威望
0
论坛币
174 个
通用积分
0
学术水平
0 点
热心指数
3 点
信用等级
0 点
经验
968 点
帖子
48
精华
0
在线时间
185 小时
注册时间
2012-12-16
最后登录
2019-8-7

5论坛币
各位大大~:
最近在做的一个评分卡模型中,涉及到一个证据权重转换(WOE转换)步骤。即将连续数值变量分段以后,使用woe转换比如可将一个拥有n个分类的变量转换成n个新变量。具体操作如图: 4WSG)GKD5PVH_0IV12N07I0.png
我的问题就是:因为最后的模型是把一个变量的所有分类都当成一个变量加入模型,这样会不会导致完全共线性出现?求大神们解答~~~

关键词:评分卡模型 评分卡 我的问题 数值变量 变量转换 评分卡模型 WOE

回帖推荐

望路人 发表于2楼  查看完整内容

并不是将所有的分类当成一个变量加入模型,而是用每个woe值取代对应的分类,最终还是一个变量

yingjunfan 发表于4楼  查看完整内容

我最近一直也在用这个模型,但是遇到一个问题:对于浏览量和其他几个维度去预测是否购买,先将浏览量分箱后,趋势是随着浏览的增多,购买的可能性越大,但是进行逻辑回归后浏览的系数确实负值,意味着随着浏览的增加,购买的可能性越低,与常识不符,请问你遇到类似问题么?如何解决呢?不知道是否是数据问题

本帖被以下文库推荐

沙发
望路人 发表于 2015-8-10 14:47:18 |只看作者 |坛友微信交流群
并不是将所有的分类当成一个变量加入模型,而是用每个woe值取代对应的分类,最终还是一个变量
已有 1 人评分经验 收起 理由
我的素质低 + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

使用道具

藤椅
望路人 发表于 2015-8-10 14:48:09 |只看作者 |坛友微信交流群
是我之前理解错了,好尴尬

使用道具

板凳
yingjunfan 发表于 2015-10-14 17:25:19 |只看作者 |坛友微信交流群
我最近一直也在用这个模型,但是遇到一个问题:对于浏览量和其他几个维度去预测是否购买,先将浏览量分箱后,趋势是随着浏览的增多,购买的可能性越大,但是进行逻辑回归后浏览的系数确实负值,意味着随着浏览的增加,购买的可能性越低,与常识不符,请问你遇到类似问题么?如何解决呢?不知道是否是数据问题

使用道具

报纸
望路人 发表于 2015-12-8 14:24:12 |只看作者 |坛友微信交流群
yingjunfan 发表于 2015-10-14 17:25
我最近一直也在用这个模型,但是遇到一个问题:对于浏览量和其他几个维度去预测是否购买,先将浏览量分箱后 ...
有可能出现多重共线性,可以试试单个变量在模型时系数的正负性与该变量与其他变量同时在模型时的系数正负性是否一样。按理说,做woe处理后系数应该是正的才对

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 21:22