|
我们在网站上获得了可用数据的完整版本https://github.com/nateGeorge/preprocess借贷俱乐部数据,每季度更新一次。Lending Club and Santander Credit CardSLP网络隐藏层数和维度SQ(z | x,y)[10 10]*,[10 20],[10 30],[10 50],[100 70]***,[10 20 10],[10 30 10],[10 40 10]*,[10 50 10],[60 90 60 60]****p(x |·)[10 10 10 10],[10 20],[10 30 30],[10 40 10],[10 40 10]***,[10 50 10],[60 90 60]****p(z |;y)[10]*,**,***,****q(a | x)[50]、[10 10 10]、[10 20]、[10 30]、[10 40]*、[10 50]、[20 40]、[20 50]、[30 50]、[30 60]、[40 60]*****q(y |·)[50]、[60]、[70]*、[80]***、[100]***、[120]、[130]**参数/超参数值Z维度30、50*,**,****, 100***a尺寸30,50**,****β0.008**、0.01、0.025、0.14、1.1*、3****、8***表2:模型1和2以及两个数据集的超参数优化网格。括号内的数字指定了每个隐藏层中的神经元数量,即[10 10]表示两个隐藏层,每个层有10个神经元。最后,Superscript*和**分别为表3中使用的借贷俱乐部数据集显示了模型1和模型2的最终架构。同样,***和****分别显示了表3中使用的桑坦德信用卡数据集模型1和模型2的最终架构。在每年的子样本中设置,因为我们希望尽可能多地保留少数群体(y=1)的观察结果。因此,我们在实验中使用的数据集有53 698个接受的应用程序,包括6 528个默认值,以及536 459个拒绝的应用程序。即接受率为9.10%,违约率为12.16%。有关借贷俱乐部数据的更多详细信息,请参见附录中的表A1。第二组数据由桑坦德北欧消费银行提供,包括通过其互联网网站提交的信用卡应用程序。
|