此外,对于对借款人资产负债表有较大影响的人数过多的班级,回忆分数也会提高。如此严重的分数不平衡也不是理想的预测质量。应注意的是,标签类不平衡(违约和全额支付的贷款)比第3.1.1节中描述的要弱得多,违约贷款占15- 数据集的20%。表1:模型第二阶段LR和SVM测试的主要结果表。贷款违约预测结果ModelαRecall Train AUC TestRecall TestLR 10-264.3%69%63.7%/63.8%/63.6%SVM 10-2.- 64.3%62.2%/58.7%/65.6%3.1.5第二阶段-神经网络线性神经网络分类器以及深层(两个隐藏层)神经网络也在模型第二阶段的数据集上进行了训练。线性神经网络分类器仅针对数字特征以及数字和分类特征进行训练。然后应用L2正则化。仅数字特征测试分数a预印本-2019年7月4日返回的AUC为67.8%,召回率为60.0%(针对违约贷款)。当引入分类特征时,该模型也产生了改进的结果。测试分数返回的AUC为68.7%,召回率为62.7%(针对违约贷款)。这些分数略低于逻辑回归的分数,但它们尚未实施正规化。一旦L2调节(α=10)被手动设置和应用,测试AUC提高到69%,召回率提高到65%(对于默认贷款)。深度神经网络(具有表2中任意两个隐藏层的节点结构DNNain)最初仅应用于数值数据。与线性分类法相比,测试AUC和召回(针对违约贷款)得分分别为68%和67%。
|