楼主: kedemingshi
724 24

[量化金融] 英国和意大利小型企业的比较分析 [推广有奖]

11
能者818 在职认证  发表于 2022-5-20 12:12:58
这些看似合理的值中的每一组都可以用来“填充”缺失的值,并创建一个“完整”的数据集。其次,可以使用完整的数据方法对每个数据集进行分析。最后,将结果合并,从而考虑到插补的不确定性。在本文中,我们使用一种称为完全条件规范的MCMC算法[2 3]。其基本思想是通过线性回归一次一个地估算不完全变量,在所有后续步骤中使用一个步骤中的变量作为预测因子。很少有研究将多重计算应用于信用评分模型【11、12、45、Lopez】。后一项研究发现,MCMCmultiple插补优于处理缺失值的其他方法,因此,本研究使用了MCMCmultiple插补。另一种处理缺失值的方法是基于所谓的粗略分类[44]。此过程包括将数值预测值划分为类别或类。通常,从最小到最大的有序值范围内,最初会产生10-20个细类。在本文中,我们将数值预测值分为10类,大小大致相同(由于不同变量的缺失值数量不同,因此不可能保持完全相同的大小)。对于每个特定类别,计算违约(或坏账或简单坏账)的比例,如果违约率非常接近,相邻类别可以进一步分组为粗略类别。缺少的值将作为单独的类别输入。

12
大多数88 在职认证  发表于 2022-5-20 12:13:01
类别可以作为二元模型输入模型,或者转换为证据权重(WoE):W oEi=lnbi/giB/G= ln公司biGgiB公司, (3) 其中BI是变量i类中的不良品(违约)数量,GI是i类中的商品(非违约)数量,B是不良品总数,G是样本中的总商品数量。鉴于logistic回归是信用评分中最常用的方法[44],WoE很有吸引力,因为这种转换会产生对数优势度量(与logistic回归的规模相同)。此外,将每个类别的对数概率与样本的对数概率进行比较:正值表示风险更高的类别,负值表示信誉更高的客户。[13] 将此方法报告为r eta il banking中使用最广泛的方法。[30]已将其应用于小企业困境建模,并发现它提高了模型的预测准确性。我们以这种方法为基准,比较替代方法处理缺失值(多重插补)和非线性(BGEVA模型)的性能。4实证分析4。1数据描述实证分析基于2010年的解释变量,预测2011年英国39785家中小企业和意大利154934家中小企业的违约情况。这些数据来自AMADEUS Bureauvan Dijk(BvD),这是一个关于欧洲公共和私营公司的可比金融和商业信息数据库。这里考虑的时间范围非常有趣,因为它包括2011年的欧洲主权债务危机。2011年夏天,意大利国债利息率失控。采用欧盟委员会对中小企业的定义。

13
何人来此 在职认证  发表于 2022-5-20 12:13:04
也就是说,一家企业的年营业额必须少于5000万欧元,资产负债表总额必须少于4300万欧元,员工人数不得超过250人(http://ec.europa.eu/enterprise/policies/sme/facts-图表分析此外,根据[32],子公司的数量上限为6家,董事人数最多为10家,与[21,36]一致。在这项工作中,我们认为当特定的中小企业破产或清算程序时,会发生违约。此外,如果中小企业处于活跃状态,且未支付债务(BvD将其归类为拖欠付款),或处于管理或破产管理或安排下(BvD将其定义为破产程序),则该中小企业也被归类为违约。相反,没有n违约者包括活跃和不活跃的SME(两个样本中只有29家)。休眠公司仍在注册,但无重大活动(会计期间无重大会计交易)。与之前的研究【3、4、39】一致,我们排除了不再作为法律实体存在的解散公司,但原因尚未明确。这符合本文的目标,即利用公开信息对破产概率进行建模。解散类别包括可能不一定经历财务困难的中小企业,它们可能会因为所有者退休或类似原因而停止交易。未来的研究可以将溶解作为一个单独的类别进行调查。通用数据库的使用确保了以相同方式测量的通用变量集在bot h国家的可用性。我们使用了在以往中小企业研究中发现很重要的财务比率[3、30、36]。采用[3]中所列变量的分类,本研究中的变量涵盖了通常使用的所有五个主要群体:o杠杆(例如:。

14
能者818 在职认证  发表于 2022-5-20 12:13:07
杠杆比率、偿付能力比率);o流动性(例如流动比率、流动比率、股东流动比率);o盈利能力(如息税折旧摊销前利润率、盈利利润率、ROCE、ROE);o保险范围(如利息保障);o活动/规模/规模(例如总资产、股东资金、员工数量、董事数量、子公司数量)。根据[36]谁发现现金流管理在预测违约方面具有重要意义,我们还包括基于现金流的衡量指标(例如现金流、现金流/营业收入)。已检查变量的线性相关性,分析中未使用高度共线的变量。表1给出了最初考虑的变量的简称和全称,以及培训样本的一些描述性统计数据。这里是表1。与意大利中小企业相比,英国样本中的中小企业在总资产、营业收入、员工数量、董事数量等方面都要大。这与第1-2节中报告的欧盟统计数据一致。两国子公司的年龄和数量的汇总统计数据相似。英国企业的负债较高,但盈利能力也较高。意大利公司表现出更好的现金流和更低的债务。尽管使用了常见的数据来源,但各国缺失价值的百分比是不同的。对于意大利,缺失数量最多的变量是现金流/营业收入,缺失19.5%。对于英国来说,这个问题要严重得多,ROCE的失踪率最高为59.2%。这会对结果产生影响,具体取决于缺失值的计算方式,如表2和表3所示,表2和表3显示了模型中10%或更低水平的变量。表2和表3。2预测准确度为了避免样本依赖性,在对照样本上测试模型的预测准确度,即。

15
可人4 在职认证  发表于 2022-5-20 12:13:10
我们使用了无样本测试。对于每个国家,整个数据集被分为培训样本(70%)和对照样本(30%),使用分层随机抽样和默认指标分层。使用的预测准确度指标包括平均绝对误差(MAE)、均方误差(MSE)和ROC曲线下面积(AUC)。MAE和MSE是预测研究中预测准确性的标准度量。O值得注意的是,MSE和MAE较低的评分模型应更准确地用于ecast违约和非违约。对于银行来说,当中小企业违约时,将其归类为非违约者的成本要高得多。如果违约者被归类为非违约者,则其将被接受为贷记,随后将丢失(部分或全部)。然而,当非违约者被归类为违约者时,这只是一个失去的机会。因此,在本研究中,MSE和MAE仅报告为默认值,并用MSE+和MAE+表示。AUC是信用评分中最常用的模型绩效衡量指标【44】,它总结了模型在整个预测PDs范围内正确排序风险的能力。值越高表示性能越好。表4和表5总结了英国和意大利估算和证据权重(WoE)数据模型的结果。考虑到英国数据的WoE方法,GEV模型在误差度量和AUC方面的表现均优于逻辑模型(表4)。这可以归因于EV克服了logistic模型低估PD的问题。此外,通过应用非参数模型(BGEVA),MSE+和MAE+的性能进一步提高。

16
可人4 在职认证  发表于 2022-5-20 12:13:14
这一事实证明,使用非参数信用评分模型可以捕捉中小企业会计特征与响应之间的非线性关系。对于英国数据的估算值,最佳MAE+和MSE+用于BGEVA,而最佳AUC在BGEVA和加性logistic模型之间共享。这进一步强调了BGEVA在预测低违约投资组合违约方面的优势。为了获得这些结果,我们使用SPSS对估算的缺失值和R-program的“BGEVA”软件包进行分析。这两种处理缺失值的方法都很好。考虑到意大利数据的WoE方法(表5),我们观察到的结果与英国模型相似。BGEVA具有最好的MAE+和MSE+,而加性logistic产生稍高的AUC,但差异可以忽略不计。对于意大利估算值,结果参差不齐。加性logistic模型显示MAE+和MSE+的最低值,而GEVand logistic模型显示AUC的较高值。由于样本量不同,缺失值的比例不同,重要变量的数量不同,因此应谨慎解释各国之间预测准确性的比较(如下一节所述)。由于英国样本量小于意大利样本量,且英国缺失值的百分比高于意大利样本量(见表1),因此可以预期预测精度会下降。然而,为了完整性起见,可以说意大利的所有车型都比英国车型具有更好的性能。此外,意大利最佳车型(BGEVA)的MAE+也最低。还应注意的是,与计算相比,WoE编码提供了更好的性能,唯一的例外是英国BGEVA的MAE+。

17
大多数88 在职认证  发表于 2022-5-20 12:13:22
对此的解释可能是缺失值的非随机性。总之,实证结果证实,BGEVA模型在两国中小企业违约预测中表现良好。这可以归因于两国的数据都不支持线性消费,这将在下一节中讨论。4.3意大利和英国中小企业风险预测因素的比较根据所使用的模型/方法,各国在重要变量及其数量方面存在差异。尽管bot h国家的逻辑回归和意大利的GEVmodel显示出相同数量的变量,无论是插补还是灾难,但即使在这些情况下,模型组成也存在差异。例如,在英国的logistic回归中,现金流、利息保障倍数和营业收入与WoE编码有关,但与插补无关;然而,通过插补,以下变量变得重要:利润、股东资金和总资产。对于其他模型,重要变量的数量与英国的GEV和BGEVA极端情况不同,其中WoE编码将重要变量的数量从11个增加到20个。这可能被解释为,至少对于某些变量,不能假设值随机缺失,因此,我们会增加重要变量的数量。在这两个国家的所有16个模型中,只有两个变量始终存在:无董事和偿付能力比率(表2和表3)。所有车型中都没有子公司,但只有一个。利润率和股东基金进入14个模型。

18
nandehutu2022 在职认证  发表于 2022-5-20 12:13:25
在这两个国家的所有16个模型中,在10%或更低水平上显著的其他常见变量包括流动比率(13)、年龄(12)、息税折旧摊销前利润率(12)、员工人数(12)、营业收入(12)、现金流量/营业收入(10)、总资产(10)、净资产收益率(10)。当分别考察每个国家最常见的重要变量(例如,每个国家一半以上模型中的常见变量)时,这些变量包括董事人数、偿付能力比率、子公司数量、利润率、股东资金和流动性比率。这证实了先前研究的结果,即盈利能力、杠杆率和流动性的衡量非常重要[2、4、36]。股东资金可以解释为股东在公司中的权益,以及公司为增长/扩张筹集资金的能力。偿付能力比率强调股东资金在公司资产中所占比例的重要性。董事人数和子公司人数可以被解释为公司规模和活动规模的代表,董事人数也可以作为管理质量的粗略衡量标准(假设董事人数越多意味着管理质量越好)。表6和表7关于遗传。尽管上述报道的共性,各国之间存在一些有趣的差异。最值得注意的是,杠杆率在所有英国车型中都很重要,而在意大利则根本不重要。这表明了该公司在英国偿还长期债务和短期债务的能力的重要性。对于意大利而言,盈利能力的衡量标准相对更为突出:息税折旧摊销前利润率和净资产收益率出现在几乎所有的意大利车型中,而盈利利润率是bot h国家常见的。在英国模式中,年龄和员工数量是前者的两倍。此前,人们发现年龄在[3]中很重要。

19
何人来此 在职认证  发表于 2022-5-20 12:13:28
Noof employees表示公司的规模或规模。意大利的财务规模通常以营业收入来表示,营业收入出现在所有意大利车型中,但仅在英国车型的一半。所有意大利车型都有现金流/营业收入。作为更详细的跨国差异的一个例子,请考虑表6中BGEVAmodel对插补值的估计。对灾难的解释不那么直接,因为它需要关于类别边界和灾难值的信息。如有要求,可提供其他型号的这些信息和详细信息。两国通用的财务指标包括盈利能力比率(利润率)、杠杆率(偿付能力比率)、流动性(流动性比率)和规模(股东资金、总资产)。此外,两国存在共同的非财务变量:年龄、董事人数、员工人数、子公司人数。这一事实强调了非财务信息在建模中小企业中的价值,并证实了之前的一些研究[4]。表6和表7报告了两国BGEVA模型的准度量和非参数成分以及多重插补的估计结果。BGEVA模型的参数部分报告了一些卵巢效应,因为它们的平滑函数估计是线性的。解释变量与线性假设的显著偏差在平滑条款部分报告。变量显示不同程度的非线性(Edf)。表6和表7中的参数Edf(自由度)控制曲线的平滑度。EDF等于1的变量显示线性平滑函数,因此它们在参数部分中报告。显示EDF远大于1的估计平滑在平滑项部分中报告。

20
何人来此 在职认证  发表于 2022-5-20 12:13:31
较大的Edf允许非常灵活的曲线,例如,可以具有多个局部最大值和最小值的曲线。根据数据估计自由度的值。图1和图2中显示了最有趣的平滑项。根据对参数分量的解释,如果协变量的估计平滑函数在减少,则当解释变量增加时,估计的P D会减少,反之亦然。图1和图2这两个国家的流动性比率和年龄都是非线性的,这两个国家之间有一些共同点。董事人数和总资产数量与英国的响应呈非线性关系,但意大利的响应不呈非线性关系,相反,现金流和员工人数仅呈现非线性模式。考虑显示两国非线性关系的流动性比率(图1和图2)。根据[39]的预期和之前的研究,对于意大利,当该变量增加时,PD降低(尽管是非线性的)。然而,对英国来说,这种关系更加复杂。从30到75,这个协变量与PDis的关系是否定的(如预期的)。然而,在中间部分,情况恰恰相反:流动性比率值的增加意味着违约机会的增加。如果分母中的流动负债减少,这可能与中小企业难以获得信贷有关。第2节总结的先前研究并未使用完全相同的比率,但[4]报告了类似变量(流动比率)与PD之间的负相关关系。应该指出的是,作者没有对潜在的非线性作出评论。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 07:41