楼主: kedemingshi
2869 114

[量化金融] 网络重构方法:经济与金融案例 [推广有奖]

31
mingdashike22 在职认证  发表于 2022-6-10 04:40:49
然而,正如作者明确指出的那样,处理过于稀疏的矩阵可能会阻止IPF算法收敛,因为IPF算法的解存在,并且当且仅当矩阵是不可约的(即网络是强连通的)时,该解是唯一的[86]。此外,无法保证IPF分配的权重数值是根据一些经验观察值分布的(例如,遵循幂律)[90]。为此,提出了该算法的第二个版本。现在,集合配置由加权网络组成,其中规定了度和权重分布。然而,这组配置的概率分布并不均匀:每个配置r=1,事实上,R的特征是无静重νR∈ (0,1)使得由等式表示的约束。(5) 在平均水平上令人满意。系综概率分布{νr}Rr=1是通过将其kl发散从均匀分布1/RRXr=1νrln中最小化而得出的νr1/R(30)在约束条件下,^souti=Prνr[souti](r)和^sini=Prνr[sini](r)i(其中{[souti](r)}Ni=1和{[sini](r)}Ni=1是集合中RTH配置的内外强度)。与公式(29)中使用的计算类似,得出概率系数νr=ePNi=1γi[souti](r)+PNj=1δj[sinj](r)Z(~γ,~δ)(31),Z(~γ,~δ)=PrePNi=1γi[souti](r)+PNj=1δj[sinj](r)的解析表达式。通常,通过求解约束方程hsoutii=^soutiandhsini=^sini,可以找到拉格朗日乘数的数值i、 然后,通过计算数量本身的总体平均值来估计任何感兴趣的数量。3.3.

32
大多数88 在职认证  发表于 2022-6-10 04:40:53
精确密度法前几节中描述的重建算法试图解决实际网络密度信息不足的问题,最重要的是避免预测过密的配置。相反,下面描述的方法明确要求了解观察到的网络密度,或者至少了解节点子集的链接密度。这是因为,如[92、81、93]所示,添加这段信息可以显著提高重建算法的性能。我们现在介绍一系列此类算法,所有这些算法都严格遵循第2.2.3.3.1节中介绍的ERGformalism。密度校正DWCM我们在第3.1.3小节中遇到的基于ERG的重建方法的第一个示例是DWCM,通过限制外强度和内强度序列获得。正如我们所看到的,DWCM诱导的系综基本上以完全连接的结构为特征,其连接密度不能独立于权重分布进行调节(见等式(20))。因此,DWCM的结果与MaxEnt方法的结果非常接近,实际上DWCM可以看作是MaxEnt的一种随机推广。为了克服这一限制,[81]的作者提出了DWCM的密度校正版本,通过限制外强度和强度序列中的链接总数L来定义:H(W | ~γ,~δ,ζ)=NXi=1(γisouti+δisini)+ζL.(32),类似于DWCM,在这种情况下链接也是统计独立的。当权重只能采用正整数值时,权重概率分布可以写为qdcdwcmij(w)=pdcDWCMij(youtiyinj)w-1(1 -youtiyinj)(33)其中PDCDWCMIj=zyoutiyinj 1+zyoutiyinj- youtiyinj(34),其中Youtian和yinjare定义为DWCM,z=e-ζ(因此,对于ζ=0,则覆盖标准DWCM)。注意,等式。

33
可人4 在职认证  发表于 2022-6-10 04:40:56
(33)确定单个伯努利试验的组成,控制任意两个节点i和j之间是否存在链接,以及其重量的几何分布,其平均值readshwijidcDWCM=pdcDWCMij1-youtiyinj。(35)最后,拉格朗日乘数在DWCM中固定,而ζ由^L=hLi获得≡Pi6=jpdcDWCMij。该方法通过向配方中显式添加一段拓扑信息来理想地定义DWCM。通过这样做,网络在网络中的发生概率仍然取决于边缘,但也取决于强加的链接数量,因此非常密集的配置变得非常不可能。3.3.2. 定向增强配置模型除了链接总数之外,还可以明确考虑异构程度。定向增强配置模型(DECM)[94]定义为:H(W | ~α,~β,~γ,~δ)=NXi=1(αIkuti+βikini+γisouti+δisini)(36),并将许多基于ERG的模型作为特例包含在内(例如,当αi=βi=ζ/2时,可获得程度校正的DWCM,i) 。DECM概率分布可以写成:P(W | ~α,~β,~γ,~δ)=NYi=1NYj(6=i)=1qDECMij(W)(37),其中qdecmij(W)=1.-pDECMijif w=0,pDECMij(youtiyinj)w-1(1 -如果w>0(38),且Pdecmij=xoutixinjyoutiyinj 1+xoutixinjyoutiyinj- youtiyinj(39)(其中xouti=e-αi,xini=e-βi,youti=e-γi和yini=e-δi)。请注意,从公式(38)可以很容易地评估通用链接权重的平均值ashwijiDECM=pDECMij1-youtiyinj。(40)拉格朗日乘子通常通过求解从似然最大化原理导出的相应4N方程来找到:i、 ^kouti=hkoutii≡Pj(6=i)pDECMij,^kini=hkinii≡Pj(6=i)pDECMji,^souti=hsoutii≡Pj(6=i)hwijiDECM,^sini=hsinii≡Pj(6=i)hwjiiDECM。对于密度校正DWCM,公式。

34
可人4 在职认证  发表于 2022-6-10 04:40:59
(38)可以解释为伯努利试验与概率pDECMij的结合,以及几何分布图与参数youtiyinj的结合;然而,在这种情况下,链路概率也取决于节点i和j的度数。当考虑特定的经济系统,即世界贸易网络(WTN)时,DECM方法有一个简单的解释。在经济方面,上述两个过程分别描述了一个普通国家i的趋势,即建立对j国的新出口(概率为pij)或加强现有出口(概率为youtiyinj,通过增加贸易的“一个单位”的商品交换量)。为了了解哪个过程更有可能,我们可以研究比率pDECMij/(youtiyinj)的行为。每当该数量大于1时,i国可能会与j国建立新的出口关系,同时会遇到某种阻力来加强这种关系;否则,i国在开始向j国出口时会遇到一定的阻力,但一旦建立了这种关系,其特点是“摩擦”相对较低,从而促使相关合作伙伴加强这种关系[95]。注意,情况pDECMij/(youtiyinj)=1意味着将等式(38)减少到Q。(18) DWCM的。换句话说,DWCM不区分第一个链接和后续链接,将qij(w)减少为简单的几何分布。如【94】所示,DWCM无法准确再现WTN的观察特性,因为它无法给予第一个链接正确的重要性,而第一个链接被视为简单的重量单位。这一观察结果暗示了编码到节点度的信息的重要性,该信息被视为真实网络重建的基本要素(与节点强度一起)。3.3.3.

35
kedemingshi 在职认证  发表于 2022-6-10 04:41:02
简化DECM:两步模型通过注意网络拓扑结构的估计在某些情况下可以与其加权结构的估计分离,可以导出DECM的简化版本。这一观察结果基于以下证据,即DECM的链接概率与更简单的ERG模型的类似概率有很大的(正)相关性,即通过仅限制度外和度内序列获得的定向二进制配置模型(DBCM)[95]。因此,Dbcm由哈密顿量(A | ~α,~β)=NXi=1(αIkuti+βikini),(41)定义,这导致连接概率Dbcmij=xoutixinj1+xoutixinj(42)与xouti=e-αi和xini=e-βi,通过通常的2N方程^kouti=hkoutii确定≡PNj(6=i)=1pDBCMijand^kini=hkinii≡PNj(6=i)=1pDBCMji,i、 将此表达式放入eqs。(38)和(40)导致q2s DECMij(w)=pDBCMij(youtiyinj)w-1(1 -youtiyinj),hw2s DECMiji=pDBCMij1-youtiyinj,(43)定义了DECM的“两步”版本,通过施加,i、 ^kouti=HKOUTIIDBCM和^kini=HKINIDBCM,然后^souti=hsoutii2s DECMand^sini=HSINII2SDECM。3.3.4. 适应度诱导指数随机图尽管有先前的发现,但我们注意到,当节点的度数未知时,不可能使用DECMor或其两步版本,这是一种非常普遍的情况。然而,这些情况可以通过求助于fitness ansatz来处理,该方法指出,任意两个节点之间的链接概率取决于所涉及节点的非拓扑特征,这是所分析系统的典型特征。

36
可人4 在职认证  发表于 2022-6-10 04:41:05
更准确地说,假设网络中每个节点i的“活动”由一个“内在”量(称为fitness)[52]构成,该量与通过单调函数关系控制该节点程度的拉格朗日乘数xi直接相关。请注意,能力值和程度之间的这种关系是所谓的“好得更富”机制的基础,根据该机制,“更好”节点(以更高的能力值为特征的节点)有更多机会“吸引”连接【52】。例如,在(无向)WTN的情况下,节点代表国家,链接代表它们之间的贸易关系,节点度的拉格朗日乘数与各自国家的国内生产总值(GDP)值之间可以观察到强烈的线性相关性:xi的√z GDPii【96,57】。因此,节点i和j之间的链路概率可以重写为ubcmij\'z GDPiGDPj1+z GDPiGDPj,(44),其中UBCM表示无向二进制配置模型。类似的能力ansatz已经成功地测试了金融网络,如银行间市场[97、98、92]和持股网络[99、100],能力ansatz的有效性对准确重建网络所需的信息种类有着深远的影响,但通常情况下,我们会面临发现与度相关的节点可观测值的问题。值得注意的是,优势通常与优势同样有效【101】,这是一个“程式化事实”,意味着DBCM拉格朗日乘数可以表示为xouti=f(^souti)和xini=f(^sini)。正如上述许多经济和金融系统的实证分析所指出的,函数形式xouti=√z(^souti)带xini=√指数b=1的z(^sini)b通常对于所有实际目的都足够精确。估计度数。

37
何人来此 在职认证  发表于 2022-6-10 04:41:08
上述线性比例假设允许以直接的方式估计未知度。实际上,连接概率或由DBCM引起的适应性假设DBCMij=z^souti^sinj1+z^souti^sinj,(45),因此剩下的唯一变量是比例常数z。。如果经验网络的链接总数^L已知,则可以简单估计后者。施加^L=hLi实际上意味着只解一个方程^L=NXi=1NXj(6=i)=1z^souti^sinj1+z^souti^sinj(46),该方程的单一解z>0[98,92]。一旦找到z,网络中任何节点i的度数都可以估计为:如果DBCM=NXj(6=i)=1pf DBCMij,hkinif DBCM=NXj(6=i)=1pf DBCMij。(47)也可以使用关于节点的asubset I的连接性的信息来获得z的估计值,例如I内部链路的总数,或属于I的所有节点的度【102,80】。事实上,在这两种情况下,似然最大化原则导致了一个与等式(46)精神相似的等式。在第一种情况下,我们有^LI=Xi∈IXj(6=i)∈Iz^souti^sinj1+z^souti^sinj,(48),而在第二种情况下,它是xi∈I(^kouti+^kini)=Xi∈INXj=1(j6=i)z^souti^sinj1+z^souti^sinj+z^soutj^sini1+z^soutj^sini!。(49)请注意,公式(23)中定义的MECAPM连接概率在此通过特殊选择z=^W恢复-1如【103】所示,选择特定节点子集的方式确实很重要。当需要对网络密度进行可靠的估计时,必须根据随机选择方案对节点进行采样,任何其他程序都偏向于较大或较小的密度值。3.3.5. 【104】中提出了结合能力诱导的ERG形式主义和theIPF配方的能力诱导DBCM和IPFAn重建方法。

38
mingdashike22 在职认证  发表于 2022-6-10 04:41:12
在这里,作者假设只知道外强度和内强度{souti,^sini}Ni=1和链接总数^L。然后,该算法包括两个步骤:o任何两个节点i和j之间的链接的存在情况按照导出的DWCM进行估计,即使用公式(46)的解z,通过公式(45);o根据IPFalgorithm,将权重放置在每个生成的二进制配置上,从而得到等式的约束。(5) 总是完全符合。3.3.6. 在解决DECM的“自举”版本时,将能力诱导的DBCM和DECMA相结合,可以更严格地为能力诱导的ERG形式主义分配权重【92】。更准确地说,要求解的方程组可以找到12月1日的拉格朗日乘数{xouti,xini,youti,yini}Ni=1hkoutiif DBCM=PNj(6=i)=1pDECMijhkiniif DBCM=PNj(6=i)=1pDECMji^souti=PNj(6=i)=1pDECMij(1-youtiyinj)-1^sini=PNj(6=i)=1pDECMji(1-youtjyini)-1.i(50)式(39)中定义了pDECMijis,式(39)中定义了hkoutiif DBC,式(50)中定义了HKINIF DBC,式(50)中定义了hkoutiif DBC,式(50)中定义了HKINIF DBC,式(39)中定义了HKINIF DBC,式(50)中定义了hkoutiif DBC,式(50。(47). 自举DECM的名称来源于节点的内外优势所起的双重作用,首先用于估计程度,然后作为补充约束施加。3.3.7. 度校正重力模型虽然DECM(原始版本和“自举”版本)代表了一种非常精确的重建方法[94,92],但其数值分辨率可以代表计算要求很高的任务。在MaxEnt配方的基础上,经济学为更简单的选择提供了主要灵感。事实上,尽管MaxEnt方法在再现许多真实网络的拓扑结构方面表现不佳,但观察到的权重可以通过公式(13)很好地再现出来【80,81】。

39
能者818 在职认证  发表于 2022-6-10 04:41:15
“度校正重力模型”(dcGM)的启发式方法提供了一种既保持重力模型的解释力又避免最终形成完整网络的简单方法【98】:wdcGMij=概率为1的0-pf DBCMijwMEij(pf DBCMij)-1概率pf DBCMiji 6=j.(51)然而,应注意,导致方程式的估算程序。(47)对度值有正则化作用,度值成为强度的平滑单调函数【98】。这反过来可能会导致求解方程的计算量更小。(50).图3:2003年观察到的eMID网络邻接矩阵(顶部面板)与根据第3.3.7节(底部面板)所述dcGM方法重建的eMID网络邻接矩阵之间的比较。左侧面板表示二进制邻接矩阵,黑色/白色表示连接的存在/不存在,而右侧面板表示加权邻接矩阵,颜色强度表示连接的权重。该等式通过将权重wMEijonly与概率pf DBCMij(即,以链接的存在为条件)放在一起,并重新缩放,以使hwdcGMiji=wMEij,从而“修正”MaxEnt配方。这样,网络边缘和链接密度平均都能正确再现(见图3)。然而,对于原始MaxEnt,只有同时考虑非零对角线条目时,才会发生这种情况。

40
何人来此 在职认证  发表于 2022-6-10 04:41:18
否则,通过限制i 6=j以上的总和,从CDGM获得的强度预期值将需要一个额外的项来重现观察到的边缘:i、 我们会得到hsoutiidcGM=^souti- ^souti^sini/^W和hsiniidcGM=^sini- ^souti^sini/^W,缺失的项正好是预期的对角线权重hwdcGMiii=^souti^sini/^W≡ wMEii。受IPF算法的启发,作者在[80]中设计了一个程序,在网络的非对角线条目上重新分布对角线项。准确地说,在类PF算法的第n次迭代中,要添加到等式(51)第二行的校正项δw(n)ij定义为δw(n+1)ij=^soutj^sinj^wδw(n)ijPk(6=j)δw(n)kj!,δw(n)ij=^souti^sini^wδw(n-1) ijPk(6=i)δw(n-1) ik!,(52)其中,算法初始化为w(0)ij=1-δij。一次渐近修正δw(∞)ij确定后,公式(51)的启发式公式被WDCGMIj=(0,概率为1)取代-pf DBCMij(wMEij+δw(∞)ij)(pf DBCMij)-1概率pf DBCMiji 6=j.(53)对于所有实际目的,少量迭代通常足以达到令人满意的精度。在这里,我们明确报告了前三次迭代的函数形式:w(1)ij=^souti^sini^wN- 1.;w(2)ij=^souti^sini^w^soutj^sinjPl(6=j)soutl^sinl!;(54)w(3)ij=^souti^sini^w^soutj^sinjPl(6=j)soutl^sinl!Pk(6=i)^soutk^sinkPm(6=k)^soutm^sinm.二部度修正重力模型。度校正重力模型可以直接扩展到二部(无向)网络的情况【100】。事实上,将公式(46)和公式(51)调整为新的问题设置就足够了。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 02:20