楼主: nandehutu2022
1343 47

[量化金融] 公司支付网络和信用风险评级 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-1 18:01:07
指数的fit支持以下观察结果,即度内和度外分布数据与幂律尾一致,估计指数分别约为2.6和2.8。类似地,内强度和外强度分别由2.1和2左右的指数幂律分布很好地拟合。尽管每个月有很大一部分节点不同,但尾部指数非常稳定(见A.3表6)。这种无标度行为在复杂网络中非常普遍,这在许多其他实际经济和金融网络中都有发现【Serrano和Bogun\'a,2003,Garlaschelli和Lofferedo,2005,Boginski et al.,2005,Boss et al.,2004,Kim et al.,2002,Huang et al.,2009,Ohnishi et al.,2009】。度的厚尾分布有两个有趣的结果:第一,平均度或强度没有特征尺度;其次,有几个节点充当系统的集线器,也就是说,有大量连接,许多节点通过它们连接。这部分解释了直径较低的原因。图1:经验互补累积度(左)和强度(右)分布及其幂律。两个轴的标度均为对数。数据指的是1月份,但其他月份的结果相似。最后,我们衡量了企业与某些属性相似的企业之间的联系趋势,即联系的数量和总量(即程度和强度)。在【Newman,2002】之后,我们计算了分类变量的分类系数,r=Pieii- aibi1-Piaibi(1),其中eijis是连接i型和j型顶点的边的分数,ai=Pjeij,bj=Pieij。

12
何人来此 在职认证  发表于 2022-6-1 18:01:10
rmax=1表示完美混合,而当网络完全分离(每个节点连接到不同类型的节点)时,rmin=-发票1-皮亚比。使用连接数作为分类变量,分类系数的高值表明,高度连接的企业往往比其他高度连接的企业的平均互动程度更高。类似的推理也适用于使用交换的体积作为分类变量。除了整个图之外,我们还考虑了评级公司的子图和客户的子图。对于所有月份和图表,这两种属性的分类系数始终略为负值,即大约-0.03对于整个图表和评级公司的子图表,以及-客户子图为0.04,月份和属性之间无明显差异。A的表7报告了每月的分类系数值汇总。一种可能的解释是,大型互联企业与许多子公司有关联,而这些子公司又与许多其他企业没有业务往来,因为它们的业务几乎完全专注于与大型和中央企业的关系。综上所述,每个月,公司的支付网络都非常稀少,但几乎完全连通。一半的公司在网络中仅以付款人的身份出现(没有传入链接),而且它们主要是未分类的客户状态,因此没有多少关于它们的信息。在剩下的节点中,几乎一半构成了网络的更密集核心,其中一半以上的事务发生,60%以上的流量循环。

13
能者818 在职认证  发表于 2022-6-1 18:01:13
最后,网络是小世界、无标度的,并且在程度和强度上都有轻微的分离。2风险分布和网络拓扑在本节中,我们研究了企业在支付网络中的风险分布。我们感兴趣的是衡量一个节点或一组节点的网络属性与节点所代表的企业风险之间的依赖关系。我们以abottom-up的方式进行,从单个节点缩小到子集。首先,我们考虑公司的本地属性(连接数),并检查其是否与风险相关。然后,我们考虑成对的关联企业,并衡量风险的同质性,即具有类似风险的企业是否倾向于一起做生意,从而相互关联。最后,我们将公司划分为由网络结构诱导的子集,并检查推断的子集是否对组成公司的风险具有信息性。具体而言,我们仅使用网络信息将网络划分为多个集团(或社区),如果每个集团内的风险分布在统计上与全球风险分布不同,则进行wetest。因此,我们的目标是了解推断出的社区在组成企业的风险比例方面是否是同质的:一个拥有许多高风险比率企业的社区清楚地表明了财务脆弱性和可能的不稳定来源,因为社区中一家或几家企业的困境可能会传播到其他企业。为简洁起见,以下分析进行了一个月,但所有月份的结果都是一致的。2.1程度和风险第一次调查是关于企业程度与其风险之间的关系。各风险等级r的可能性∈ 五十、 M,H条件为out度数,并根据度数计算和绘制。结果如图2所示。

14
何人来此 在职认证  发表于 2022-6-1 18:01:16
我们注意到程度和风险之间有一种有趣的相关性:小程度节点更可能是中等风险企业,而大程度节点更可能是低风险企业。高风险企业在不同程度上分布更均匀,即使在低程度节点上观察到的比例更大。为了评估这三条曲线在统计上是否不同,我们对数据进行了多项式逻辑回归【Greene,2003】(图中的实线)。这一选择的依据是,刚才描述的数量是给定因变量(度)的多类问题的结果概率。估计的概率与经验分布的趋势非常接近,系数都很重要。更详细的试验结果见B.1表8(前两列)。刚刚强调的相关性至少在一定程度上受到了企业规模的影响(从资产负债表中的资产价值来看):大型企业通常被认为比小型企业没有风险,同时,规模越大通常意味着联系的数量越高,例如在银行间网络中【Bargigli等人,2015年】。由于我们无法获得公司的规模,我们使用收入和支出的总和作为代理。通过这种方式定义,大小与内外度的皮尔逊相关系数约为0.19、0.15,但斯皮尔曼秩相关系数分别为0.67、0.57。为了控制规模的影响,我们对企业子集重复相同的过程,根据其规模将其分组为三分之一。结果(此处未显示,但可根据要求提供)也成立。in度的结果在质量上非常相似。图2:一家公司的评级概率取决于其出局程度。

15
kedemingshi 在职认证  发表于 2022-6-1 18:01:19
实线显示了拟合的多项式逻辑分布,其置信区间(虚线)颜色匹配。在子样本上,但稍微不太明显。我们重复多项logistic回归,将预测因子中的大小三分位数相加,我们仍然获得了具有统计意义的系数(B.1第8列中的最后四列)。同样,三个条件度分布给出了统计上不同的评级结果,每个月,所有对都拒绝了2样本KolmogorovSmirnov检验中的无效假设【Smirnov,1939年】。因此,节点的拓扑特征(程度)可用于获取相应企业的风险信息。从风险管理的角度来看,这是一个重要的结果,因为平均而言,高度连接的节点风险也较小。2.2风险的分类混合下一步是检查风险是否与直接连接偏好相关。为了阐明这一点,我们考虑了两个特征:风险的分类混合和给定距离的评级条件分布。在第一种情况下,我们计算公式(1)中分类系数的加权变量,使用风险评级作为分类变量,而不是程度或强度。在实践中,数量Eijar被eij所取代,eij是来自类型为ito的节点和类型为j的节点的体积分数。选择此选项的原因是为了减轻上述大量未分类付款人的影响。在大多数情况下,它们的链接与低交易量和少量交易相关。

16
能者818 在职认证  发表于 2022-6-1 18:01:22
此外,客户公司,即使他们仅代表约三分之一的公司,无论是在交易数量还是交易量方面,通常都表现出更为激烈的活动,因此,客户公司之间的联系更加紧密。所有三个图表的指标均为正值,整个集合、评分节点和客户的指标分别为0.070、0.157、0.163,各月变化显著,但始终为正值。在B.2的表9中,标准分类系数的结果值汇总非常不同,并给出了每个月的子图分类系数的选择。在相同数量的情况下,eijwe确定了指标,以评估收入和支出之间的不同偏好。我们通过测试传入和传出连接之间的不同风险分布来测试企业是否更关心付款人的风险而不是收款人的风险。为了区分这两种情况,对于每个节点i,我们计算相对于特定风险类别中节点平均值的体积超额百分比,并根据节点的评级进行分组。使用MannWhitney U检验对分布进行比较【Mann和Whitney,1947年】。这种非参数检验允许评估一个分布是否随机大于另一个分布。B.2中给出了指标和测试的详细信息。我们发现,企业很可能至少部分意识到了同行的风险,结果表明,他们在选择业务合作伙伴时使用了这些信息。然而,数据并不支持这样的假设,即收入支付显示出对低风险的明显偏好。此外,总体的积极排序主要是由于低风险节点。

17
何人来此 在职认证  发表于 2022-6-1 18:01:26
这表明,低风险企业在选择业务伙伴时更加谨慎,这可能也是因为它们相对较高的信用度使它们更容易找到可用的合作伙伴。本节迄今为止所考虑的数量是最近邻分类之间的成对比较,并给出了一个聚合度量。丰富此信息的一种可能方法是考虑给定距离处节点的评级条件分布,并将其与无条件分布进行比较。在比率对连接模式没有影响的情况下,给定距离的风险条件分布应在统计学上与零无条件分布不可区分。为了测试是否存在这种情况,我们首先计算所有可用评分节点之间的距离。然后,对于任何固定的k,通过查看配对距离k的集合来计算评级的出现率。最后,使用酸酐几何检验对估计的分布与空分布进行测试,如B.3中详细解释的。图3总结了4月份的结果,其中考虑了sourcenode处于L类的情况。当考虑到中等或高风险源时,结果相似。对于每个k,标记表示距离k处具有低(绿色圆圈)、中(黄色方块)或高(红色方块)风险的节点的百分比。当百分比在统计上不同于零分布(虚线和匹配颜色)时,标记为满。我们注意到,高达距离5的低风险企业在分布中的代表性显著过高。在距离更远的地方,中等和高风险群体的人数过多。这意味着需要在网络中采取更多步骤,以接触风险较高的企业。

18
nandehutu2022 在职认证  发表于 2022-6-1 18:01:30
考虑到每个公司在理论上都不知道其他公司的评级,有时甚至不知道自己的评级,这一事实尤其有趣。似乎至关重要。当考虑整个网络时,分类系数为负,大约-0.07,因此表明风险方面存在轻微的偏离行为。相反,子图显示了一种分类趋势,对于有评级的节点和forcustomers的节点,系数分别约为0.025和0.038。这种转变可以用大量未分类节点的影响来再次解释。最近,Arcagni等人提出了一种在分类计算中超越一阶邻域的替代策略【Arcagni等人,2017年】。网络中节点之间的距离定义为连接两个节点的最短有向路径的长度,其中路径是一系列链接。显然,在有向网络中,通常d(u,v)6=d(u,v),而且d(u,v)不能定义(或∞) 如果没有从u到v的路径。当考虑到传入路径的相同数量时,结果(未显示)非常相似,即在短距离内,低风险等级被过度表示,而中等和高风险节点在较长距离内被过度表示。图3:距离为k的节点与额定值为L的节点的额定值分布。灰线是整个样本中节点之间额定值的无条件(空)分布。完整标记表明,在1%显著水平的超几何测试中,通过Bonferroni校正,全分布的过度或不足表示在统计学上是显著的。对这些观察结果的一种可能解释是,在系统的中心(即连接最紧密的节点)中,评级为L(即信誉度最高)的企业占绝大多数。

19
nandehutu2022 在职认证  发表于 2022-6-1 18:01:33
这在考虑输入和输出链接时都适用,也包括没有评级的节点。此外,它们位于前面描述的更密集的核心,而许多高风险企业只有很少或没有向外链接,它们是网络中的外围设备。当考虑到节点的贴近度中心度分布【Newman,2010】时,也可以观察到网络中位置的不对称性,即到所有其他节点的距离的调和平均值,条件是风险等级(未显示)。2.3网络组织与风险在本节中,我们研究了网络组织在更总体层面上与风险分布之间的关系。我们对两种类型的网络组织感兴趣,即分组。第一个是模块化组织:每个模块都由节点组成,节点之间的连接比与网络其余部分的连接要紧密得多。例如,从经济角度来看,模块可以代表在同一地区或地区运营的企业,模块的高密度反映了地理位置相近的企业付款更频繁的事实。我们之前看到,网络在风险方面表现出一种排序趋势,因此我们想测试在成对关系之外是否可以观察到风险的同质性。第二种是分级组织。由于支付网络是定向的,因此我们需要一个排名分区(即每组节点都标有从1到组数M的整数),这样大多数链接都是从低等级节点到高等级节点。例如,这种类型的组织可以代表一条供应链,集团公司与nextrank类别的集团公司之间的支付流量反映了(相反的)商品或服务流量。

20
nandehutu2022 在职认证  发表于 2022-6-1 18:01:36
这种分类很重要,因为高风险集中在等级分明的网络的低等级节点上,会在高等级节点上引发一连串的灾难。模块化和层次结构在概念上是相反的,因为第一种惩罚了与其他组的连接,而后者鼓励这种连接(前提是它们从低级别节点转移到高级别节点)。对于每个指标,我们按照以下方式进行:i.根据标准找到最佳划分;二。计算分区中每个子集的评分分布;iii.通过使用前一节中使用的超几何测试和B.3中所述的超几何测试,测试此类局部分布是否在统计上不同于评级的总体分布。为了有足够大的样本来执行测试,我们只考虑至少有500个已知评级的子集。到目前为止,我们表明,支付网络的结构非常复杂。由于我们的目标是获取有关企业风险的信息,因此在执行社区检测之前对网络进行过滤会很有帮助,以便保持最相关的连接。因此,我们将重点放在客户的子图上。做出这种选择的原因有很多。首先,每月处于活动状态的节点比例很低,约为20%,但如果仅考虑客户,则会上升到70%(汇总见A.1中的表4)。在考虑节点子集时,这将有助于获得更多信息的局部风险分布。其次,一半以上的交易量是在客户之间转移的(见a.1中的表3),因此,即使大部分交易被丢弃,我们也大多在修剪弱连接,同时保留最强的连接。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-12 03:32