楼主: 何人来此
574 24

[量化金融] 英国和意大利小企业的比较分析 [推广有奖]

11
大多数88 在职认证  发表于 2022-5-11 11:13:09
每一组看似合理的值都可以用来“填充”缺失的值,并创建一个“完整”的数据集。其次,每个数据集都可以使用完整的数据方法进行分析。最后,将结果合并在一起,这样就可以考虑插补的不确定性。在本文中,我们使用了一种称为完全条件规范[2 3]的MCMC算法。其基本思想是通过线性回归一次一个地估算不完全变量,在所有后续步骤中使用一个步骤中的可变因子作为预测因子。很少有研究将多重计算应用于信用评分模型[11,12,45,Lopez]。后一项研究发现,MCMCmultiple插补优于其他处理缺失值的方法,因此,本研究采用了MCMCmultiple插补。另一种处理缺失值的方法是基于所谓的粗分类[44]。此过程包括将数值预测值划分为类别或类。通常情况下,从最小到最大的订购值范围内,最初会产生10-20个FINE类。在本文中,我们将数值预测分为10类,大小大致相同(由于不同变量的缺失值数量不同,不可能保持完全相同的大小)。对于每一个细类,计算违约(或坏帐或简单的坏帐)的比例,如果违约率足够接近,相邻类别可以进一步分组到粗类中。缺少的值将作为单独的类别输入。

12
nandehutu2022 在职认证  发表于 2022-5-11 11:13:12
类别可以作为二元模型输入模型,也可以转换为证据权重(WoE):W oEi=lnbi/giB/G= 自然对数比吉布, (3) 其中Bi是变量i类中的不良品(违约)数量,Gi是i类中的商品(非违约)数量,B是不良品总数,G是样本中商品的总数量。鉴于logistic回归是信用评分中最常用的方法[44],WoE很有吸引力,因为这种转换会产生对数优势度量(与logistic回归的规模相同)。此外,将每个类别的对数概率与样本的对数概率进行比较:正值表示风险更高的类别,负值表示信誉更高的客户。[13] 将此方法报告为r eta il银行业务中使用最广泛的方法。[30]将其应用于小企业困境建模,发现它提高了模型的预测准确性。我们使用这种方法作为基准,比较替代方法处理缺失值(多重插补)和非线性(BGEVA模型)的性能。4实证分析4。1数据描述实证分析基于2010年的解释变量,预测2011年英国39785家中小企业和意大利154934家中小企业的违约情况。这些数据来自AMADEUS Bureauvan Dijk(BvD),这是一个关于欧洲公共和私营企业的可比财务和商业信息数据库。这里考虑的时间范围非常有趣,因为它包括2011年的欧洲主权债务危机。2011年夏天,意大利国债利率失控。采用欧盟委员会对中小企业的定义。

13
大多数88 在职认证  发表于 2022-5-11 11:13:16
也就是说,一家企业的年营业额必须低于5000万欧元,资产负债表总额必须低于4300万欧元,员工人数不得超过250人(http://ec.europa.eu/enterprise/policies/sme/facts-图表分析此外,根据[32]的规定,子公司的数量上限为6人,董事人数上限为10人,与[21,36]一致。在这项工作中,我们认为,当特定的中小企业破产或清算程序时,就会发生违约。此外,如果中小企业处于活跃状态,且未支付债务(BvD将其归类为违约支付),或处于管理或破产管理或安排下(BvD将其定义为破产程序),则该中小企业也被归类为违约。相反,没有n-违约者包括活跃和休眠的SME(两个样本中只有29家)。休眠公司仍在注册,但无重大活动(会计期间无重大会计交易)。与之前的研究[3,4,39]一致,我们排除了不再作为法律实体存在的解散公司,但原因没有具体说明。这符合本文的目标,即利用公开信息对破产概率进行建模。解散类别包括可能不一定经历财务困难的中小企业,它们可能因为所有者退休或类似原因而停止交易。未来的研究可以将溶解作为一个单独的类别进行调查。通用数据库的使用确保了通用变量集的可用性,以同样的方式对bot h国家进行测量。我们使用的财务比率在之前的中小企业研究中非常重要[3,30,36]。采用[3]中所列变量的分类,本研究中的变量涵盖了通常使用的五个主要群体:o杠杆(例如:。

14
nandehutu2022 在职认证  发表于 2022-5-11 11:13:19
杠杆比率、偿付能力比率)流动性(例如流动比率、流动比率、股东流动比率)盈利能力(如息税折旧摊销前利润率、净利润率、ROCE、净资产收益率)保险范围(如利息保险)活动/规模/规模(例如总资产、股东资金、员工数量、董事数量、子公司数量)。根据[36]发现现金流管理在预测违约方面具有重要意义的人,我们还包括基于现金流的指标(例如现金流、现金流/营业收入)。已经检查了变量的线性相关性,在分析中没有使用高度共线的变量。表1给出了最初考虑的变量的简称和全名,以及培训样本的一些描述性统计数据。表1在这附近。与意大利中小企业相比,英国样本中的中小企业在总资产、营业收入、员工数量和董事数量方面都更大。这与第1-2节中报告的欧盟统计数据一致。这两个国家的年龄和子公司数量的汇总统计数据相似。英国企业的负债较高,但盈利能力也较高。意大利公司表现出更好的现金流和更低的债务。尽管使用了常见的数据来源,但各国缺失价值的百分比是不同的。对于意大利来说,缺失数量最多的变量是现金流/营业收入,缺失19.5%。对于英国来说,这个问题要严重得多,ROCE的最高失踪率为59.2%。这会对结果产生影响,具体取决于缺失值的计算方式,如表2和表3所示,表2和表3显示了模型中10%或更低水平的显著变量。表2在这里,表3在这里。2预测准确度为了避免样本依赖性,在对照样本上测试了模型的预测准确度,即。

15
能者818 在职认证  发表于 2022-5-11 11:13:23
我们使用了大量的样本测试。对于每个国家,整个数据集被分为培训样本(70%)和对照样本(30%),使用分层随机抽样,并对默认指标进行分层。使用的预测准确度指标包括平均绝对误差(MAE)、均方误差(MSE)和ROC曲线下面积(AUC)。MAE和MSE是预测研究中预测准确性的标准度量。O值得注意的是,MSE和MAE较低的评分模型应更准确地用于ecast违约和非违约。对于银行来说,当中小企业违约时,将其归类为非违约者的成本要高得多。如果违约者被归类为非违约者,则该违约者将被接受为贷记,随后将损失(部分或全部)。然而,当非违约者被归类为违约者时,这只是一个失去的机会。因此,在本研究中,MSE和MAE仅报告为默认值,并用MSE+和MAE+表示。AUC是信用评分[44]中最常用的模型性能指标,它总结了模型在整个预测PD范围内正确排序风险的能力。较高的值表示性能更好。表4和表5总结了英国和意大利估算和证据权重(WoE)数据模型的结果。考虑到英国数据的WoE方法,GEV模型在误差度量和AUC方面都比逻辑模型表现出更好的性能(表4)。这可以归因于EV克服了logistic模型低估PD的问题。此外,通过应用非参数模型(BGEVA),MSE+和MAE+的性能进一步提高。

16
nandehutu2022 在职认证  发表于 2022-5-11 11:13:27
这一事实证明了非准度量信用评分模型的使用,该模型可以捕捉中小企业的会计特征与响应之间的非线性关系。对于英国数据的估算值,最佳MAE+和MSE+用于BGEVA,而最佳AUC在BGEVA和加性逻辑模型之间共享。这进一步强调了BGEVA在预测低违约投资组合违约方面的优势。为了获得这些结果,我们使用SPSS对估算的缺失值和R程序包“BGEVA”。两种处理缺失值的方法都很好。考虑到意大利数据的WoE方法(表5),我们观察到的结果与UK模型类似。BGEVA具有最好的MAE+和MSE+,而加性逻辑产生稍高的AUC,但差异可以忽略不计。对于意大利估算值,结果好坏参半。加性logistic模型显示MAE+和MSE+的最低值,而GEVand logistic模型显示AUC的较高值。由于不同的样本量、不同比例的缺失值和不同数量的重要变量(如下一节所述),应谨慎解释各国之间预测准确性的比较。由于英国样本量小于意大利样本量,且英国缺失值的百分比高于意大利(见表1),因此可以预期预测准确度会降低。然而,为了完整性起见,可以说意大利的所有车型都比英国车型有更好的性能。此外,意大利最佳车型(BGEVA)的MAE+也最低。还应注意的是,与计算相比,WoE编码提供了更好的性能,英国BGEVA的MAE+除外。

17
kedemingshi 在职认证  发表于 2022-5-11 11:13:31
对此的解释可能是缺失值的非随机性质。总之,实证结果证实,BGEVA模型在两国中小企业故障预测中表现良好。这可以归因于两国的数据都不支持线性消费,这将在下一节中讨论。4.3意大利和英国中小企业风险预测因素的比较根据所使用的模型/方法,各国在重要变量及其数量方面存在差异。尽管bot h国家的逻辑回归和意大利的GEVmodel显示了相同数量的变量,无论是插补还是灾难,但即使在这些情况下,模型组成也存在差异。例如,在英国的逻辑回归中——现金流、利息保障和营业收入与WoE编码有关,但与插补无关;然而,通过插补,以下变量变得重要:利润、股东资金和总资产。对于其他模型,重要变量的数量与英国的GEV和BGEVA极端情况不同,其中WoE编码将重要变量的数量从11个增加到20个。这可能被解释为,至少在某些变量中,值不能被认为是随机缺失的,因此,我们需要增加重要变量的数量。在这两个国家的所有16个模型中,只有两个变量始终出现:董事人数和偿付能力比率(表2和表3)。没有子公司出现在所有模型中,只有一个。利润率和股东基金进入14个模型。

18
大多数88 在职认证  发表于 2022-5-11 11:13:35
在这两个国家的所有16个模型中,在10%或更低水平上显著的其他常见变量包括流动性比率(13)、年龄(12)、息税折旧摊销前利润率(12)、员工人数(12)、营业收入(12)、现金流/营业收入(10)、总资产(10)、净资产收益率(10)。当分别研究每个国家最常见的重要变量时(例如,每个国家超过一半的模型中的常见变量),这些变量包括董事人数、偿付能力比率、子公司数量、利润率、股东资金和流动性比率。这证实了之前研究的结果,表明可盈利性、杠杆率和流动性的衡量非常重要[2,4,36]。股东资金可以解释为股东对公司的利益,以及公司为增长/扩张筹集资金的能力。偿付能力比率强调股东资金在公司资产中所占比例的重要性。董事和子公司的数量可以被解释为公司规模和活动规模的代表,董事数量也可以作为管理质量的粗略衡量标准(假设更多董事意味着更好的管理)。表6关于这里表7关于遗传尽管上述报道的共性,但各国之间存在一些有趣的差异。最值得注意的一点是,杠杆率在所有英国车型中都很重要,而在意大利则根本不重要。这表明了该公司在英国偿还长期债务和短期债务的能力的重要性。对于意大利而言,盈利能力的衡量标准相对更为突出:息税折旧摊销前利润率和净资产收益率出现在所有意大利车型的lmo中,而非bot h国家常见的盈利利润率。在英国车型中,年龄和员工数量是前者的两倍。在[3]中,人们发现年龄很重要。

19
mingdashike22 在职认证  发表于 2022-5-11 11:13:38
Noof employees表示公司的规模或规模。意大利的财务规模通常以营业收入来表示,营业收入出现在所有意大利车型中,但仅出现在英国车型的一半。现金流/营业收入也存在于所有意大利车型中。作为更详细的跨国差异的一个例子,请考虑表6中给出的BGEVA模型对估算值的估计。对灾难的解释不那么直接,因为它需要关于类别边界和灾难值的信息。如有要求,可提供这些型号的信息和详细信息。两国通用的财务指标包括盈利能力比率(利润率)、杠杆率(偿付能力比率)、流动性(流动性比率)和规模(股东资金、总资产)。此外,在这两个国家,还有一些常见的非财务变量:年龄、董事人数、员工人数、子公司人数。这一事实强调了非财务信息在中小企业建模中的价值,并证实了之前的一些研究[4]。表6和表7报告了两国BGEVA模型的准度量和非参数成分以及多重插补的估计结果。BGEVA模型的参数部分报告了一些卵巢效应,因为它们的平滑函数估计是线性的。解释变量与线性消费的显著偏差见平滑条款部分。变量显示出不同程度的非线性(Edf)。表6和表7中的参数Edf(自由度)控制曲线的平滑度。EDF等于1的变量显示线性平滑函数,因此它们在参数部分中报告。显示EDF远大于1的估计平滑在平滑项部分中报告。

20
能者818 在职认证  发表于 2022-5-11 11:13:43
较大的Edf允许一条非常灵活的曲线,例如,一条可以有多个局部极大值和极小值的曲线。自由度的值是根据数据估计的。最有趣的平滑项显示在图1和图2中。与对参数分量的解释一致,如果协变量的估计平滑函数在减小,则随着解释变量的增加,估计的P D减小,反之亦然。这两个国家的流动性比率和年龄都是非线性的,这两个国家之间有一些共同点。董事和总资产的数量与英国的响应呈非线性关系,但与意大利的响应呈非线性关系,相反,现金流和员工数量仅呈现非线性模式。考虑流动性比率,它显示了两国之间的非线性关系(图1和图2)。根据[39]的预期和之前的研究,在意大利,当该变量增加时,PD降低(尽管是非线性的)。然而,对英国来说,这种关系更加复杂。从30到75,这个协变量与PDI的关系是否定的(如预期)。然而,在中间部分,情况恰恰相反:流动性比率值的增加意味着违约机会的增加。如果分母中的流动负债减少,这可能与中小企业难以获得信贷有关。第2节总结的先前研究并未使用完全相同的比率,但[4]报告了类似变量(流动比率)与PD之间的负相关关系。应该指出的是,作者没有评论潜在的非线性。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 15:48