混迹在各个论坛和学习贴有小一年的时间,使用SAS软件开发金融行业的评分卡模型也有一年多的时间,现在就在论坛里做个经验的分享。评分卡模型分为A卡(申请)、B卡(行为)、C卡(催收),对于贷款的不同阶段有不同的评分卡模型,今天就先来说说A卡(申请评分卡)。
直接主题:
开发流程:
1、评分卡模型的可行性研究
首先你要对开发评分卡的贷款产品有一定的业务了解,大致有以下几个维度
1)产品现状(产品的每月通过量、逾期率)
2)产品Vintage、Roll Rate
3)可选变量的IV效用
当然如果是你boss下达的任务,那可行性调研也就那么回事了
2、数据准备
1)开发评分卡所需数据的准备是最最花时间的,包括公司内部的数据和接入的第三方外部数据,需要进行数据的异常处理、数据的清洗以及造衍生变量,这个过程就需要对业务逻辑有一定的了解,包括通过第三方数据创造衍生变量;
2)确定训练样本和验证样本以及Y
样本的确定有很多因素,比如客群变化的因素,当然就是时间越近越好;样本量的大小;Y的定义是最好能有一个比较好的表现期,但消费金融公司往往Y的表现期不够长,那就考虑Y的转化率比较高同时坏样本能更多的覆盖到坏客群的特征;
3)挑选入选模型变量
可以使用IV遍历排序,然后选取排序较高IV的变量,但也要考虑变量的业务定义,比如有些变量如百融的收入变量虽然确实比较大,但因为变量对于bad or good客户的区分能力比较强,所以也要考虑为入选变量
3、WOE转化和Logistic建模
对准备好的变量数据进行离散化WOE转化,进行多重共线性检验,跑Logistic模型并且对模型结果进行效用分析,最后进行分数的转化,输出模型变量的分组区间以及相应的权重
4、模型的验证
利用验证数据去校验模型的效用,比如KS、LIFT、GINI、PSI等指标,输出模型变量分组的通过率以及逾期率的分布曲线,保证模型具有准确性、较好的区分能力以及稳定性
至此,模型开发已经大致结束,后续需要对开发的模型进行测试、上线以及上线后的模型监控。
今天就先分享到这里了!