楼主: kedemingshi
2866 114

[量化金融] 网络重构方法:经济与金融案例 [推广有奖]

81
大多数88 在职认证  发表于 2022-6-10 04:43:26
(154)如果ris是参数数量较少的模型(即DWCM)和ris是参数数量较多的模型(即DECM),则LRT比较数量D=2Lr(^G | ~^λ(r))-2Lr(^G | ~^λ(r))(155)到一些适当定义的阈值Dth。后者由威尔克斯定理[173]确定,指出D的概率分布近似为一个平方分布,自由度数等于| ~λ(r)|- |~λ(r)|,即模型和模型r的参数数量之间的差异。相反,当考虑对数似然函数时,最佳算法的特点是最接近零的值。5.2. Akaike信息标准为了能够比较两个以上的模型,可以使用更明确的Akaike信息标准(AIC)[174175176]。在一组竞赛模型中,表现最好的r的特点是最大值为AICR=2Mr- 2Lr(^G | ~^λ(r))。(156)因此,AIC是一种模型特定指数,与模型参数数量mr与其最大对数似然之间的差异(成比例)。将参数数量添加到对数似然函数可以消除过度设置问题,AIC代表着在解释能力和简单性之间找到最佳权衡的尝试。方程式(156)提供了随后确定的其他类似标准的基线。例如,当经验观测的数量n相对于参数的数量变得太小时(经验法则是n/Mr<40[174175]),修改后的数量aiccr=AICr+2Mr(Mr+1)n-先生- 应使用1(157)。AICc惩罚参数过多的模型,甚至比AIC更严重;始终,无论何时n Mr,AICc收敛到AIC,等式(156)恢复。5.3.

82
可人4 在职认证  发表于 2022-6-10 04:43:29
贝叶斯信息准则AICc的一个替代准则是贝叶斯信息准则(BIC)[174175176]。二者之间的差异在于将术语的功能形式添加到最大可能性。BIC不仅折扣了参数数量,还折扣了观测数量:BICr=Mrln n- 2Lr(^G | ~^λ(r))。(158)额外项ln被认为使BIC比AIC更具限制性,因为前者倾向于选择参数数量低于后者的模型【174175】。然而,哪种标准表现最好,在什么条件下,仍然是一个有争议的问题。最后,我们要强调上述标准的普遍适用性。事实上,所有这些都可以扩展到量子熵测量[108]。此外,尽管所有这些标准都是基于可能性的(即,它们只能用于比较通过似然函数定义的模型),但它们也可以用于一致地比较概率算法和确定性算法(足以将这些算法的似然函数设置为零)。在任何情况下,尽管存在形式上的差异,所有描述的基于信息的标准都传达了相同的信息:“良好”的重建算法不仅需要准确地记录观察到的数据,还需要避免过度拟合,从而在准确性和节约性之间达成良好的权衡。5.4. 快速查看多模式平均值除了在一篮子备选方案中个性化最佳模型外,AIC、AICc和BIC还可以量化每个模型带来的相对改进。

83
mingdashike22 在职认证  发表于 2022-6-10 04:43:32
这是通过计算Akaike(或等效的贝叶斯)权重来实现的,读取WR=e-r/2PR=1e-序号2,(159),其中r=AICr- min{AICs}Rs=1(或者,在BIC情况下,r=BICr- min{BICs}Rs=1),其中R是竞争模型的总数。某个模型的Akaike(或贝叶斯)权重通常被解释为相应模型是最合适的模型的可能性。尤其是具有 ≤ 2有大量的统计支持;带有4个≤  ≤ 7支持较少,型号 > 10基本上没有支持(值得注意的是,也可以定义密集区间)[174175176]。最后,为了量化给定模型ris相对于竞争对手模型r的优劣程度,可以计算wr/wr的比率。在表2中,我们为(无向)ECM和WCMon几个经验网络提供了此类样本测试。我们发现,除了前两个社交网络,ECM总是优于WCM,实现单位概率(在机器精度范围内)。对网络进行更仔细的检查(结果正好相反),可以发现这些网络(几乎)是完全连接的。在这些情况下,degreesequence表示冗余约束,因此可以引用参数较少的模型。

84
能者818 在职认证  发表于 2022-6-10 04:43:36
这些结果提供了额外的证据,表明为了重建具有非平凡拓扑的网络,度传递的信息不可还原为强度信息。网络wAICWCMwAICECMO办公室社交网络1 0研究小组社交网络1 0兄弟会社交网络0 1马斯帕洛马斯泻湖食物0 1切萨皮克湾食物网0 1水晶河(对照)食物网0 1水晶河食物网0 1米奇根湖食物网0 1蒙得哥河口食物网0 1沼泽地食物网0 1意大利银行间网络(1999年)0 1世界贸易网(2000年)0 1表2:Akaike用于重建第一列中所列经验网络的WCM和ECM权重【94】。除了前两个基本上完全连接的网络外,学位信息的包含是非冗余的,ECM的性能大大优于WCM。最后,每当这些测试中没有成功的模型出现时,Akaike(或贝叶斯)权重仍然可以用来解释同一参数的多个估计值,例如{u}。保留提供这些估计值的模型的解释力的一种方法是:根据模型的“相关性”(例如,Akaike权重)对估计值进行平均(160)。等式(160)说明了多模态平均的概念:因此,用于重建网络的估计为^u。结论和展望网络在我们的生活中越来越普遍,因此网络模型和方法在科学和社会中变得越来越重要。无论这个世界的发展和技术水平如何,我们都将努力(可能会越来越多)获取描述它所需的信息。

85
大多数88 在职认证  发表于 2022-6-10 04:43:39
现在,对于像WWW这样大的系统,除了部分信息之外,基本上不可能收集任何信息。因此,我们相信,未来将越来越需要处理部分信息所需的基本仪器知识,为在现代统计物理中新使用集合方法铺平道路。到目前为止,最先进的技术清楚地表明,重建方法的性能在很大程度上取决于几个因素。为了找出解决当前问题的最佳方法,最近人们致力于在大量经验网络上比较不同的算法。此类“赛马”旨在量化各种算法相对于第4节中介绍的指标系列的性能,特别注意拓扑算法。下面,我们简要总结了上述艺术的现状以及对未来作品的展望。6.1. 比较现实世界网络上的不同重建算法,尽管MaxEnt方法的基本原理植根于对金融系统的经验观察(银行倾向于最大限度地扩大其多样性,因为在压力传播的情况下,完整市场被认为比不完整市场更稳健[138]),人们普遍认为,MaxEnt在再现给定网络的拓扑细节方面表现得很差。另一方面,MaxEnt和“copula”方法在再现观察到的权重方面表现出色,这是由(加权)余弦相似性所指示的【61】。然而,真正的金融市场非常稀少[177]。因此,MaxEnt方法必须辅之以能够再现给定网络结构拓扑细节的规定。

86
可人4 在职认证  发表于 2022-6-10 04:43:42
尽管密度修正的DWCM约束了边缘和链接密度(从而再现了两者),但它可能无法再现高阶拓扑量[81]。通过这些算法独立于权重(例如,以两步方式)估计拓扑细节,可以获得更好的性能。例如,等式(46)所述的能力诱导ERG模型不仅(在很大程度上)再现了经验系统的入度序列和出度序列[92],而且还通过链接概率的函数形式来表征,以确保观察到的分离趋势得到正确复制[81]。此外,这种方法能够令人满意地再现相同网络的结构细节[80],从而比其他将相同类型信息作为输入的方法更有效[81]。[61]中进行了更详细的分析,重点是统计指标,其中指数由等式定义。(103),(109),(110)和(111)已被用于不同的重建算法。结果是,“强调”金融机构之间的联系结构的措施有利于产生更稀疏网络的方法,而“强调”双边敞口规模的措施有利于尽可能均匀分配敞口的方法。更具体地说,根据准确度指数、汉明距离和雅卡距离,能力诱导模型和最小密度算法都表现出色。然而,前者“在集成方法中显然是胜利者[…]所有利益衡量标准“[61]。在【93】中进行了另一轮比较,将贝叶斯方法的性能与能力诱导ERG模型的性能进行了比较。

87
nandehutu2022 在职认证  发表于 2022-6-10 04:43:45
为此,作者采用了第3.5.2小节中讨论的“经验”方法,其中调整参数以匹配实际网络密度。“经验”贝叶斯方法和能力诱导模型在准确性、敏感性和特异性方面都表现良好。这证实,只要考虑到二进制网络拓扑,适应性诱导ERG模型似乎是迄今为止可用的最佳算法。就权重重建而言,适应度诱导ERG模型在陆地地形下得分最高,但在PTS指数下优于贝叶斯方法。后者量化了在数字生成的网络样本中发现重构权重的概率,重构权重的大小在观察值的10%以内。如【93】所述,Bayesianaproach成功的原因在于,它可以生成以不同权重范围为特征的配置,而能力诱导ERG模型通过简单的伯努利分布分配权重,因此找到满足上述要求的值的概率较小。然而,应该注意的是,通过使用加权随机图模型(其性能甚至优于贝叶斯方法)可以获得相同的成功结果,并指出任何有效的广义算法似乎都能够在PTS指数下获得高分。换言之,在该指数下令人满意地执行的要求似乎不适用于任何专门为重建设计的算法。

88
何人来此 在职认证  发表于 2022-6-10 04:43:49
总的来说,贝叶斯方法的多功能性(即其产生大量不同拓扑结构和权重分布的能力)使其成为设计可行的神经网络(在其上运行压力测试)的好方法,而不是重建特定的网络结构。在[178]中,作者调整了前几节中描述的几种方法,以应对二分银行信贷网络的重建。这些算法的原始版本和修改版本之间的主要区别在于通过IPF算法实现的权重分配步骤。一般来说,作者观察到的是,最佳性能取决于特定指标和聚合水平。然而,除了MaxEnt和MinimumDensity方法分别获得最高灵敏度和最高特异性的微不足道结果之外,作者发现,所考虑的ERG模型变体(即方法inspiredName ME Type Category简要描述第2节参考文献MaxEnt 3稠密确定性通过限制边缘3.1.1【76,77】IPF 3可调确定性最小化与Maxent3.1.2【86】的KLDifference,最大化了网络中心上的ShannonentryMECAPM 3密集概率约束矩阵中心平均匹配最大值3.1.4【84】Drehmann&Tarashev 3可调概率随机扰动最大重构3.2.2【88】Mastromatteo等人。

89
nandehutu2022 在职认证  发表于 2022-6-10 04:43:52
3可调概率利用Message-Passingalgorith3.2.3[79]Moussa和Cont 3可调概率实现IPFon非平凡拓扑3.2.4[90]适应度诱导ERG 3精确概率使用fitnessansatz通知指数随机图模型3.3.4[98,92]Copula方法5稠密确定性通过边缘3.5.1【115】甘迪和维拉特5可调概率实现可调贝叶斯重建3.5.2【116】蒙塔尼亚和卢森堡5可调概率假设依赖于边缘的连接概率3.5.4【118】哈拉杰和科克5概率使用外部信息定义(地理)概率图3.5.5【120】最小密度5稀疏概率最小化网络密度,同时满足第3.5.6条[121]表3:本工作中审查的重建方法概述。根据【179】和【104】,“始终表现最佳”【178】和“能够相对较好地重建邻接矩阵和加权网络,并且能够在所有(数据)聚合级别上保留实际网络的统计特性”【178】。有趣的是,重建方法在再现动态(财务)指标方面的性能也得到了测试。正如作者所注意到的,即使是空模型preservingdegrees也无法准确再现系统性风险的实际水平(定义为银行违约概率[178])。

90
kedemingshi 在职认证  发表于 2022-6-10 04:43:55
然而,受[179]启发的模型(其次是受[104]和MaxEnt启发的模型)“与实际网络的整体行为最为接近,而最小密度则显示出不同聚合级别之间的不一致性能”[178]。一般来说,能力诱导ERG模型在复制二元拓扑结构方面表现良好,因为它提供了对网络中度的真实估计。一些研究表明,采用局部拓扑属性作为输入的方法可以优于采用更多非拓扑性质信息作为输入的模型(例如,WTW的地理距离)[180]。6.2. 是否真的需要链接密度?上述所有“赛马”都指出了算法的优越性能,该算法可以校准以再现观察到的链路密度,而不是无法再现的链路密度:换句话说,网络链路密度构成了必须考虑的一段信息,以便实现准确的重建。然而,正如作者在[93]中强调的那样,网络密度不能仅从边缘来推断。因此,必须从一开始就知道这一点。如果不是这样的话(就像经常发生的那样),那么处理估计链路密度的问题并不总是那么简单。尽管仅仅知道一个网络子图,事实上,通常可以确保准确估计实际的链接密度,但必须仔细选择此类条目。正如【103】中所建议的,应采用随机选择方案,以避免可能的偏差,当节点根据某种标准进行采样时,可能会出现这种偏差。正如【80】中的作者所示,如果(组)节点是根据其总强度来选择的,那么得到的密度估计值将最大程度地取决于特定子集值pi∈I^stoti。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 08:14