楼主: hopezsh
4822 5

有做信用评分logistic回归,需要数据分箱(Binning)求帮助的吗? [推广有奖]

  • 0关注
  • 11粉丝

博士生

9%

还不是VIP/贵宾

-

威望
0
论坛币
221 个
通用积分
77.4287
学术水平
1 点
热心指数
0 点
信用等级
0 点
经验
2784 点
帖子
118
精华
0
在线时间
305 小时
注册时间
2006-11-9
最后登录
2024-3-1

楼主
hopezsh 在职认证  发表于 2017-6-21 11:28:38 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人之前做过评分建模工具的开发,接触到FICO的相关资料,对其Divergence模型原理精通,并且有Model Builder试用版软件,
如您在信用评分建模方面有需求,可以与本人交流,可协助进行数据分箱、Logistic回归、Divergence评分模型的建立、评估。
另外,本人对SPSS Clementine Matlab都精通,可以交流~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logistic回归 logistic ogistic logisti logist 信用评分 数据分箱 Model Builder Logistic回归 评分卡

本帖被以下文库推荐

嚼着菜根谈数学
沙发
hopezsh 在职认证  发表于 2017-6-21 17:23:41 |只看作者 |坛友微信交流群
数据分箱通常是指对连续变量进行区间划分,将连续变量划分成几个区间变量,主要目的是为了避免“过拟合”,使评分结果更具有稳健性和预测性。这里有个典型的例子就是:用决策树进行评分看起来效果不错,但往往都会因为”过拟合”,模型无法实际应用。

常用的变量分箱法是WOE法,分两步:
(1)先对连续变量平均细分成足够多的分箱,FICO称之为Fine Bining(细分箱)。
(2)对相邻分箱两两合并计算比较,按照“WOE损失最小”的原理,来确定合并哪两个相邻分箱,直至达到预先设定的阈值,这一步FICO称之为Coarse Bining(粗分箱)。

判断分箱结果是否复合实际意义、有效,通常最直接的方法,就是看:Coarse Bining分箱结果图是否有一定的趋势,最常见的就是直线型、U型,因为一个输入变量对输出变量的关系往往都是有一定规律性的。
譬如:收入越高,信用越高;欠款次数越多,信用越低。

用FICO的Model Builder是可以很方便的处理,可以做Logistic模型、Divergence模型,如下是相关截图:
1.png
嚼着菜根谈数学

使用道具

藤椅
sqy 发表于 2017-6-21 21:17:40 |只看作者 |坛友微信交流群
你的这个Model Builder是FICO的开发工具吗?

使用道具

板凳
hopezsh 在职认证  发表于 2017-6-22 07:54:53 |只看作者 |坛友微信交流群
不是,这个是FICO公司的评分卡建模工具,我们之前开发的评分工具没有推广出来,而且不够智能化,所以最后不了了之了。

使用道具

报纸
静照忘求 在职认证  发表于 2017-8-23 18:26:33 |只看作者 |坛友微信交流群
楼主可以私信一个微信吗,交流交流

使用道具

地板
boredbird 发表于 2017-9-8 15:30:48 |只看作者 |坛友微信交流群

楼主 and  楼上 可以私信一个微信吗,交流交流

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 15:38