楼主: hopezsh
5331 5

有做信用评分logistic回归,需要数据分箱(Binning)求帮助的吗? [推广有奖]

  • 0关注
  • 11粉丝

已卖:31份资源

博士生

9%

还不是VIP/贵宾

-

威望
0
论坛币
211 个
通用积分
77.2787
学术水平
1 点
热心指数
0 点
信用等级
0 点
经验
2784 点
帖子
118
精华
0
在线时间
306 小时
注册时间
2006-11-9
最后登录
2025-9-24

楼主
hopezsh 在职认证  发表于 2017-6-21 11:28:38 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人之前做过评分建模工具的开发,接触到FICO的相关资料,对其Divergence模型原理精通,并且有Model Builder试用版软件,
如您在信用评分建模方面有需求,可以与本人交流,可协助进行数据分箱、Logistic回归、Divergence评分模型的建立、评估。
另外,本人对SPSS Clementine Matlab都精通,可以交流~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logistic回归 logistic ogistic logisti logist 信用评分 数据分箱 Model Builder Logistic回归 评分卡

本帖被以下文库推荐

嚼着菜根谈数学

沙发
hopezsh 在职认证  发表于 2017-6-21 17:23:41
数据分箱通常是指对连续变量进行区间划分,将连续变量划分成几个区间变量,主要目的是为了避免“过拟合”,使评分结果更具有稳健性和预测性。这里有个典型的例子就是:用决策树进行评分看起来效果不错,但往往都会因为”过拟合”,模型无法实际应用。

常用的变量分箱法是WOE法,分两步:
(1)先对连续变量平均细分成足够多的分箱,FICO称之为Fine Bining(细分箱)。
(2)对相邻分箱两两合并计算比较,按照“WOE损失最小”的原理,来确定合并哪两个相邻分箱,直至达到预先设定的阈值,这一步FICO称之为Coarse Bining(粗分箱)。

判断分箱结果是否复合实际意义、有效,通常最直接的方法,就是看:Coarse Bining分箱结果图是否有一定的趋势,最常见的就是直线型、U型,因为一个输入变量对输出变量的关系往往都是有一定规律性的。
譬如:收入越高,信用越高;欠款次数越多,信用越低。

用FICO的Model Builder是可以很方便的处理,可以做Logistic模型、Divergence模型,如下是相关截图:
1.png
嚼着菜根谈数学

藤椅
sqy 发表于 2017-6-21 21:17:40
你的这个Model Builder是FICO的开发工具吗?

板凳
hopezsh 在职认证  发表于 2017-6-22 07:54:53
不是,这个是FICO公司的评分卡建模工具,我们之前开发的评分工具没有推广出来,而且不够智能化,所以最后不了了之了。

报纸
静照忘求 在职认证  发表于 2017-8-23 18:26:33
楼主可以私信一个微信吗,交流交流

地板
boredbird 发表于 2017-9-8 15:30:48

楼主 and  楼上 可以私信一个微信吗,交流交流

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-5 20:11