楼主: nandehutu2022
1337 47

[量化金融] 公司支付网络和信用风险评级 [推广有奖]

41
kedemingshi 在职认证  发表于 2022-6-1 18:02:44
由于支付量是按比例计算的,因此wmin的值没有多少信息,因此对于strengthF(wmin)=1- 改为报告EDCF(wmin)。学位强度月αinkinminαoutkoutminαinF(winmin)αOUT(woutmin)一月2.55 159 2.85 24 1.89 0.03 1.89 0.01二月2.56 148 2.80 19 2.10 0.03 1.99 0.01三月2.53 125 2.70 44 2.11 0.03 1.97 0.01四月2.67 257 2.82 22 2.14 0.03 2.01 5月2.66 227 2.83 23 2.12 0.03 2.07 0.01六月2.58 135 2.83 23 2.07 0.03 1.96 0.01 7月2.52 124 2.80 21 2.07 0.03 2.02 0.01 8月2.62 236 2.74 14 2.07 0.03 1.94 0.01 9月2.64 187 2.83 32 2.09 0.04 2.03 0.01 10月2.53 129 2.75 25 2.05 0.03 1.95 0.01 11月2.59 134 2.83 19 2.06 0.03 2.04 0.01 12月2.55 180 2.62 41 2.06 0.03 1.98 0.01表7:度和强度的分类系数。具有额定值的列指具有已知额定值的节点的子图。列customers指的是customer status为yes的节点的子图。所有评级客户的属性度强度节点均为评级客户jan-0.035-0.035-0.046-0.036-0.031-0.046Feb-0.027-0.029-0.036-0.030-0.031-0.039Mar-0.025-0.030-0.038-0.027-0.027-0.037Apr-0.027-0.030-0.029-0.041可能-0.026-0.033-0.039-0.027-0.026-0.035Jun-0.025-0.027-0.032-0.028-0.030-0.037Jul-0.025-0.028-0.036-0.028-0.028-0.038Aug-0.027-0.035-0.040-0.032-0.034-0.041Sep-0.024-0.027-0.030-0.028-0.030-0.036Oct-0.028-0.028-0.037-0.032-0.033-0.043Nov-0.023-0.028-0.031-0.026-0.028-0.035Dec-0.027-0.030-0.034-0.031-0.035-0.041B风险分配b。1度和风险多项式logistic回归旨在对具有两种以上结果的分类问题的概率进行建模。在这里,我们将反应(L、M、H)视为分类和有序。实际上,这意味着要找到最适合modellog的参数P(r≤ 五十) P(r>L)= aL+bLX。。。

42
kedemingshi 在职认证  发表于 2022-6-1 18:02:48
+bpLXp+日志P(r≤ M) P(r>M)= aL+bMX…+bpMXp+。a和bi·是预测因子,a和bi·是系数。我们考虑了p=1的情况,其中预测因子是X=k的程度,以及p=2的情况,其中大小也用作预测因子X=s。下表8显示了b系数,以及统计显著性的指标。表8:多项式逻辑回归系数。前两列是指与作为唯一预测因子的程度的回归。最后四列指的是回归,其大小也是预测值。上标表示预测值:k表示度,s表示大小。下标表示风险评级。星号表示显著性:如果p值<0.05,则为一颗星,如果p值<0.01BKLBKKBKLBSLBSLBKMBSMJAN 0.258**0.352**0.261**-0.007 0.312**0.091**2月0.221**0.305**0.210**0.024**0.233**0.159**3月0.226**0.314**0.220**0.013 0.237**0.173**4月0.243 0.328**0.240**0.007 0.270**0.131**5月0.229 0.324**0.206**0.050 1**0.237**0.195**6月0.239**0.325**0.232**0.017*0.237**0.199**7月0.238**0.344**0.227**0.026**0.263**0.187**8月0.183**0.272**0.175**0.020*0.179**0.211**9月0.238**0.355**0.218**0.046 0.255**0.228**10月0.220**0.329**0.207**0.030**0.232**0.220**11月0.226**0.338**0.211**0.034**0.233**0.234**12月0.219**0.331**0.220**-0.002*0.231**0.227**B.2风险分类表9:风险分类系数评级具有额定值的列是指具有已知额定值的节点的子图。列customers指的是customer status为yes的节点的子图。

43
kedemingshi 在职认证  发表于 2022-6-1 18:02:51
在最后两列中,对分类性指标进行了修改,以考虑权重,具体而言,eijis是以体积分数计算的,而不是边缘数(有关更多详细信息,请参阅正文)。公制标准权重节点(所有带有评级客户端)JAN-0.063 0.025 0.035 0.073 0.115 0.109Feb-0.066 0.026 0.038 0.106 0.181 0.188Mar-0.067 0.025 0.039 0.073 0.150 0.150Apr-0.067 0.026 0.036 0.069 0.154 0.156May-0.067 0.025 0.038 0.065 0.146 0.139Jun-0.068 0.026 0.039 0.060 0.150 0.1287月-0.072 0.025 0.037 0.046 0.142 0.137 8月-0.078 0.025 0.040 0 0.078 0.1490.224Sep-0.067 0.025 0.040 0 0.087 0.168 0.216Oct-0.076 0.024 0.037 0.080 0.151 0.213Nov-0.072 0.024 0.039 0.070 0 0.175 0.149Dec-0.082 0.024 0.040 0.037 0.199 0.151要测试节点在传入和传出付款之间是否显示不同的偏好,我们定义数量(in)i(X)=w(in)i(X)- aX  br(i)1- aX▄br(i),X∈ {L,M,H}(out)i(X)=w(out)i(X)- ar(i)bX1- ar(i)bX,X∈ {L,M,H}。该符号与(1)中的定义一致:r(i)是节点i的风险;aX,bx是整个网络中从或到额定值为X的节点的体积百分比,w(out)i(X)(w(in)i(X))是从(到)节点i到(从)额定值为X的节点的体积百分比。通过按额定值分组节点获得样本,共有18(=(3个额定值)·2个方向)分布。例如,从L到Mis的超额体积百分比分布如下所示:{i(M)(out)| i∈ L}~ F(out)L(M)。类似地,从H输入M的过量体积百分比由下式得出{i(H)(in)| i∈ M}~ F(in)M(H)。请注意,通常,F(in)X(Y)6=F(in)Y(X)。我们进行了两组测试。在第一种情况下,我们确定一个评级,并比较某个评级的超额和超额百分比。

44
nandehutu2022 在职认证  发表于 2022-6-1 18:02:54
在所有情况下,零假设都被很低的p值所拒绝,但要给出总体结果的经济学解释并不容易:对于所有评级,向L的超额百分比大于流入量的类似百分比,而向H和从H支付的超额百分比则相反。在第二组测试中,我们确定了评级和方向(向内或向外),我们比较了所有评级的超额百分比。此外,在这种情况下,所有测试都会以非常低的p值拒绝null,因此我们可以对分布进行排序,并评估相关的偏好。对于出货量,在所有情况下,评级L优先于风险更高的产品。对评级为M的节点的付款优先于风险为M和H的节点,但对于评级为L的节点,付款顺序为最后。对于收入付款,情况略有不同。评级为M和H的节点首选评级为M,其次是L。而评级为DL的节点的付款则相反。B、 3社区内风险分布的检验正文中采用的统计检验旨在评估给定的比率在某一子集中的代表性是否过低或过高,这是通过本文描述的一种划分方法获得的。一般来说,这意味着测试单个子集中的评级分布是否与考虑整个样本获得的无条件分布有统计学差异。为此,我们计算p值,该p值表示在无效假设下观察每个社区中给定数量评级的概率,即评级在社区中分布,如同在整个样本中一样。如【Tumminello等人,2011年】所示,零位下的概率是超几何分布。

45
mingdashike22 在职认证  发表于 2022-6-1 18:02:57
此外,由于对每个社区进行了多个测试(每个评级和社区一个测试),因此对多个假设测试的p值进行了修正。特别是,选择了Bonferroni校正,即固定了p值的阈值Ps,校正后的阈值由PSNR给出,其中Nr是测试次数。校正前,ps=1%时的is通量阈值。具体地说,给定一个分区{Ci},计算以下数量Kx,i={Ci中的节点,等级x}ni={Ci中的节点}Kx={Ci中的节点}N={节点},p值由p=(p(y>Kx,ikx,ini>KxN)p(y<Kx,ikx,ini<KxN),y~ 超几何KLN、KMN、KHN;N.请注意,{Kx}和Nare是在考虑中的特定月度网络中计算的。在以距离为条件的分布情况下,通过考虑节点对来获得子集。例如,计算距离kfrom H处等级为L的节点的分数asp(k)HL=|{(i,j):d(i,j)=k,i∈ H、 j∈ 五十} | |{(i,j):d(i,j)=k,i∈ H} |。其他方法产生的分区在子集的数量和大小方面非常不同,因此为了使测试具有可比性,只有社区包括至少500个已知等级的节点。在模块化的情况下,子集按大小降序排列。请注意,由于每个月活动节点集和子集的标签都会发生变化,因此无法轻松地跨月比较子集的行为。表10和表11给出了测试的总结,记录了每个月和风险等级无效假设被拒绝的次数,分为超过(+)和低于(-) 代表性。

46
大多数88 在职认证  发表于 2022-6-1 18:03:00
最后两列包含分别测试的数字类,以及总计(nC)。表10:测试结果汇总:模块化M H+++-+测试nC95%nCJan 4 9 8 6 5 17 19 71 2月5日9 9 9 7 20 1900Mar 5 13 7 2 8 4 20 20 20 70APR 4 9 7 7 7 7 6 19 20 20 20 2年5月3 9 8 7 5 18 18 18 1856年6月5 11 6 21 15 2148 7月6 10 5 3 18 18 18 1862 UG 5 12 8 8 8 5 26 08 9 9 9 2 4 4 4 12 1879年10月11 9日12 12 12 12 12 12 12 1922Nov 5 9 9 4 4 4 4 5 18 18 18 8 12 12 12 10 3 7 3 19 152323表11:测试结果总结:分层M H+++-+测试的nC95%nC hJan 5 5 4 3 5 12 11 18 0.75Feb 5 4 4 5 12 11 17 0.74Mar 4 4 4 4 4 4 12 18 0.74Apr 4 4 3 6 12 10 0.75May 6 4 4 3 6 12 18 0.74Jun 5 3 4 4 6 12 11 17 0.75Jul 4 3 3 3 3 4 5 5 12 11 10.74Aug 6 3 5 5 5 5 5 5 5 14 10 0.789月5 4 4 4 4 4 4 4 4 6 10 10 10 0.7410 5 3 4 3 5 12 11 17 0.73 11月5日3 4 3 5 12 10 180.75Dec 4 3 4 3 7 12 12 19 0.75C分类。1数据预处理众所周知【Friedman et al.,2001】重新缩放/转换数据,以便∈ [0,1]或∈ [-1,1]或标准化,通常可以提高分类的性能,尤其是当不同的预测因素具有非常不同的规模时。所以,在训练模型之前,我们进行数据预处理,特别是:i.对于入度和出度,我们使用度对数的分位数变换。上述这些量的幂律尾部分布解释了这种选择,目的是避免数据过于分散;二。分类的预测因素已经∈ [0,1]不需要预处理;iii.将节点分布到层次类中是标准化的,即每个秩被移位并重新缩放为平均值0 ad方差1;iv.模块是唯一的分类变量。通常的二进制转换会为每个可能的值生成一个新的二进制变量。

47
mingdashike22 在职认证  发表于 2022-6-1 18:03:03
如前所述,模块的数量非常多,但其中一小部分包含几乎所有的节点,因此我们只保留那些节点数超过500个的模块,并将所有剩余的模块合并为一个剩余类;v、 分位数变换也适用于大小的对数分布。C、 2模型训练和超参数优化模型训练使用已实施的软件包进行:对于多项式逻辑和分类树,使用了Scikit learn Python软件包【Pedregosa等人,2011年】,而对于神经网络,使用了Keras Python软件包【Chollet等人,2015年】和Tensor Flow【Abadi等人,2015年】。然而,在优化过程中,定义模型架构的参数,即所谓的超参数,保持不变。因此,通常的做法是使用这些超参数的不同值来训练许多模型,并根据所选指标比较性能。关于这一主题的深入讨论超出了本文的范围,我们参考【Bergstra和Bengio,2012】和相关文献以获取详细信息。这里,我们对感兴趣的超参数应用一个简单的网格搜索。这对于一步和两步分类都已完成。我们采用的指标考虑了风险类别的领域特定解释。特别是,我们希望对低风险类别的更多错误分类进行处罚,即→\'L,H→\'M,H→\'L和towardsdistant类,即L→\'\'H,H→L.因此,除了标准精度和调用外,我们还考虑精度wsacc、召回wsrec、精度wspr的加权分数,这是混淆矩阵C的函数。

48
nandehutu2022 在职认证  发表于 2022-6-1 18:03:06
带符号Cx,y=|{x→ y}|,C·,y=XxCx,y,x、 y型∈ {L,M,H}X表示实际类,而'X表示预测类。wsacc=C·、·Xx、y∈{L,M,H}Cx,yPaccx,y,Pacc=1.-0.25-0.5-零点七五一-0.25-1.-零点七五一wsrec=Xx,y∈{L,M,H}Cx,yCx,·Precx,y,Prec=1.-0.25-0.75-零点七五一-0.25-1.-0.75 1.75wspr=Xx,y∈{L,M,H}Cx,yC·,yPprx,y,Ppr=1.-0.25-0.75-零点七五一-0.25-1.-0.75 1.75对于分类树,感兴趣的超参数是深度,即分类需要满足的最大条件数(或从根到叶的最长路径的长度)。深度值越高,训练误差越小,但可能导致过度拟合。我们考虑了深度值从3到10。对于一步模型,深度为6的树是最佳选择,而对于两步模型,第一步树的深度为9,第二步树的深度为5,获得了最佳结果。对于神经网络来说,感兴趣的超参数是隐藏层的数量和大小。与之前一样,这些值增加太多可能会导致过度拟合。为了避免在添加层时参数数量过多,我们会随着它们数量的增加不断减小它们的大小(直观地说,参数的数量增加为qi | li |,其中| li |是第i层的大小)。例如,对于1(隐藏)层,节点数在10到100之间,而对于两个层,每个节点数从5到10。对于一步模型,使用1层50个节点可获得最佳结果,而对于2步模型,最佳选择是第一步使用2层5个节点,第二步使用1层10个节点。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 11:15