请选择 进入手机版 | 继续访问电脑版
楼主: 万木青
869 2

[数据挖掘书籍] ‘信用评分方法’部分知识点的咨询(《IBMSPSS 数据分析与挖掘实战案例精粹》第18章) [推广有奖]

  • 4关注
  • 1粉丝

博士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
2876 个
通用积分
5.6096
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
2168 点
帖子
136
精华
0
在线时间
195 小时
注册时间
2014-10-20
最后登录
2021-4-12

万木青 发表于 2019-9-30 09:24:35 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
基于工作的需要和个人兴趣,近日仔细研究了《IBMSPSS 数据分析与挖掘实战案例精粹》第18章‘信用评分方法’,对其中的部分公式产生疑问,基于个人学识有限及学术严谨性,现在此咨询,希望能得到专家的确认。
如:
(1)、第412页的 WOE= ln(好客户占比/坏客户占比)*100 公式,是否应该将乘以100去掉?我查阅了其它资料,关于WOE的公式都只写到 WOE = ln(好客户占比/坏客户占比),包括R语言专门用于最优分箱的Smbinning包的计算结果也没有乘以100,如果只是结果呈现那倒没什么,问题是这个woe会影响到最终评分值的计算。
(2)、417页的 Score + pdo =...右边是否多了一项Factor,从后面的计算结果来看,应该是
Score + pdo = Offset + Factor *  ln(2* odds)
(3)、418页的 Score = ∑ (Offset/n -Factor * ( a/n βj* woe)) 是否少了一个+号,β下标是否应该是i.正确的式子是否为:Score = ∑ (Offset/n -Factor * ( a/n+ βi* woe))
另外,书中的样本是3000条,1、0类各占50%,作者为了使数据类别比例与实际接近,采用了过简单的采样方法,将0类的每条记录重复30次,最终得到0类为45000条,类别占比0:1为97%:3%,之后再这些数据经过一系列的处理转换,最终用被用于构建Logistic模型,这样不是相当于在数据类别极不平衡的情况下建模,得到的模型特征系数还有意义?(如果拿模型去预测,岂不是都预测为0类)书中最终拿这些系数去计算信用评分,这样做可以?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析与挖掘 信用评分 SPSS 数据分析 评分方法

阿扁V5 学生认证  发表于 2019-10-11 17:45:24 |显示全部楼层 |坛友微信交流群
首先你没有把书贴出来,其次woe是可以不用*100,另外简单重复抽样增加好样本比例是为了模拟实际情况,但是这种简单重复抽样跟实际情况肯定会有比较大的差异,至于你说的会不会都预测为0,这个取决于好坏样本的区分度

使用道具

万木青 发表于 2019-10-13 10:56:15 |显示全部楼层 |坛友微信交流群
阿扁V5 发表于 2019-10-11 17:45
首先你没有把书贴出来,其次woe是可以不用*100,另外简单重复抽样增加好样本比例是为了模拟实际情况,但是这 ...
好的,谢谢!相关书籍网上有免费的可以下载!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 14:27