楼主: 万木青
705 0

[问答] 信用评分建模 WOE等知识点的确认咨询 [推广有奖]

  • 4关注
  • 1粉丝

已卖:165份资源

博士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
2895 个
通用积分
5.7446
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
2168 点
帖子
136
精华
0
在线时间
195 小时
注册时间
2014-10-20
最后登录
2021-4-12

楼主
万木青 发表于 2019-9-30 09:33:56 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
基于工作的需要和个人兴趣,近日仔细研究了《IBMSPSS 数据分析与挖掘实战案例精粹》第18章‘信用评分方法’,对其中的部分公式产生疑问,基于个人学识有限及学术严谨性,现在此咨询,希望能得到专家的确认。
如:
(1)、第412页的 WOE= ln(好客户占比/坏客户占比)*100 公式,是否应该将乘以100去掉?我查阅了其它资料,关于WOE的公式都只写到 WOE = ln(好客户占比/坏客户占比),包括R语言专门用于最优分箱的Smbinning包的计算结果也没有乘以100,如果只是结果呈现那倒没什么,问题是这个woe会影响到最终评分值的计算。
(2)、417页的 Score + pdo =...右边是否多了一项Factor,从后面的计算结果来看,应该是
Score + pdo = Offset + Factor *  ln(2* odds)
(3)、418页的 Score = ∑ (Offset/n -Factor * ( a/n βj* woe)) 是否少了一个+号,β下标是否应该是i.正确的式子是否为:Score = ∑ (Offset/n -Factor * ( a/n+ βi* woe))
另外,书中的样本是3000条,1、0类各占50%,作者为了使数据类别比例与实际接近,采用了过简单的采样方法,将0类的每条记录重复30次,最终得到0类为45000条,类别占比0:1为97%:3%,之后再这些数据经过一系列的处理转换,最终用被用于构建Logistic模型,这样不是相当于在数据类别极不平衡的情况下建模,得到的模型特征系数还有意义?(如果拿模型去预测,岂不是都预测为0类)书中最终拿这些系数去计算信用评分,是否不当?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:信用评分 知识点 woe Logistic模型 logistic

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 08:53