|
图1显示了违约率如何随接受的借款人比例变化(预测违约率最低的借款人首先被接受)。接收机工作特性曲线(ROC)绘制了分类器的真阳性率与假阳性率的对比,跟踪了接受率变化时的性能。根据信用评分文献,我们报告了该曲线下的面积(AUC),以总结可能接受阈值范围内的绩效。一个天真的分类器将生成0.5的AUC,而一个完美的分类器将生成1.0的AUC。图2说明了最佳基准模型(逐步logistic)和最保守模型的ROC,使用的指标来自电话数据(随机森林每周集合)。表3给出了各种规格的结果,用AUC测量性能。(使用表S3中的替代指标评估绩效)。将显示整个样本的结果,然后是有和没有信贷局记录的子样本的结果。在这类有thinfiles的人群中,信贷局信息在预测还款方面表现不佳(AUC 0.51-0.57)。对于局指标,logistic模型优于随机森林,表明这些指标与还款之间的潜在关系是相对线性的。相比之下,标准型号builton phone indicators(CDR)具有预测性,在同一时间段进行培训和测试时,AUC达到0.71-0.77。我们更为保守的CDR-W模型在同一时间段(AUCs 0.62-0.63)进行培训和测试时,性能较低,但也优于信贷局模型。我们的模型的表现也在已发布的发达国家传统信贷蔑视传统贷款的实时AUC估计样本范围内(0.50-0.79,如表S4所示)。
|