|
类别可以作为二元模型输入模型,或者转换为证据权重(WoE):W oEi=lnbi/giB/G= ln公司biGgiB公司, (3) 其中BI是变量i类中的不良品(违约)数量,GI是i类中的商品(非违约)数量,B是不良品总数,G是样本中的总商品数量。鉴于logistic回归是信用评分中最常用的方法[44],WoE很有吸引力,因为这种转换会产生对数优势度量(与logistic回归的规模相同)。此外,将每个类别的对数概率与样本的对数概率进行比较:正值表示风险更高的类别,负值表示信誉更高的客户。[13] 将此方法报告为r eta il banking中使用最广泛的方法。[30]已将其应用于小企业困境建模,并发现它提高了模型的预测准确性。我们以这种方法为基准,比较替代方法处理缺失值(多重插补)和非线性(BGEVA模型)的性能。4实证分析4。1数据描述实证分析基于2010年的解释变量,预测2011年英国39785家中小企业和意大利154934家中小企业的违约情况。这些数据来自AMADEUS Bureauvan Dijk(BvD),这是一个关于欧洲公共和私营公司的可比金融和商业信息数据库。这里考虑的时间范围非常有趣,因为它包括2011年的欧洲主权债务危机。2011年夏天,意大利国债利息率失控。采用欧盟委员会对中小企业的定义。
|