楼主: 何人来此
1309 28

[量化金融] GDP驱动的二元结构和加权结构模型 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-5-6 23:07:00
事实上,变量~z*可被视为适性参数[6,37],控制形成链接的概率。研究发现,一个国家的能力参数(由模型指定)与同一国家的GDP之间存在非常有趣的相关性[37]。图2中复制了这种关系,其中每个国家的重新调整的GDP(gi≡将GDPiPiGDPi)与适应性参数z的值进行比较*IOB通过求解公式(5)得出。红线是typezi的线性图=√a·gi。(6) 这导致了一种更经济的解释,在这种解释中,适应性参数可以用国家的GDP替换(达到一定比例常数),并用于重现网络的属性。[6]中选择的这一程序可以仅基于国家的宏观经济属性对网络进行预测,并揭示GDP在ITN二元结构中的重要性。重要的是,这一观察结果是第一次实证支持将适应性模型作为一种强大的网络模型[41]。同样,其他研究也表明,观测到的拓扑性质在解释宏观经济动力学方面非常重要[2,3]。C.加权结构尽管拓扑结构很重要,但后者只是商品交易的主干,对此类交易量的了解非常重要。为了能够预测连接的权重,我们需要从一组二元图切换到一组加权图。BCM最简单的加权对应物是WCM,它是加权网络的最大熵集合,其中约束是强度序列,即。

12
何人来此 在职认证  发表于 2022-5-6 23:07:03
就ITN而言,每个国家的总贸易额。最近的研究表明,WCM预测的高阶二元量以及相应的加权量与观察到的对应量非常不同[16,17]。更具体地说,该模型的主要局限性在于预测一个基本均匀且非常密集(有时完全连通)的拓扑结构。粗略地说,该模式通过将贸易总额分配给几乎所有其他国家,从而过度“稀释”了每个国家的贸易总额。无法正确复制真实网络的纯拓扑投影是预期和观察到的高阶属性之间不一致的根源。1.与重力模型的关系就像BCM与适应性模型[6]相关一样,WCM的一个变体与重力模型[18]相关。该变体实际上是WCM的一个连续版本,其中强度序列受到约束,KKNN、Xknn\\0.60.70.80.91.01.1kc、Xc\\1\'1075\'1062\'1073\'1063\'1071.5\'1077\'106ssnn、Xsnn\\1\'1045\'1041\'105scW、XcW\\图3。比较观察到的无向二进制和加权属性(红点)和2002年快照中聚合ITN的ECM(蓝点)的对应装配平均值。左上角面板:平均最近邻度KNN与度ki;右上角的面板:二元聚类系数civs度ki;左下面板:平均最近邻强度snnversus强度si;右下面板:加权聚类系数CWVSUSSTRENGHT si。权重是实数而不是整数。当应用于ITN时,该模型给出了以下链路重量预期:hwiji=T·gigji、 j(7)式中,T是网络中的总强度,GI是按比例重新调整的GDP[18]。

13
可人4 在职认证  发表于 2022-5-6 23:07:07
从本质上讲,上述表达式再次确定了GDP和指定节点强度的隐藏变量(类似于二进制情况下的清晰度)之间的关系。方程式(7)与方程式(1)一致,其中β=1,γ=0。因此,该模型对应于重力模型的一个特别简单的版本。事实上,该模型相当好地再现了观测到的ITN的非零权重[18]。然而,就像重力模型一样,该模型预测了一个完整的图,其中aij=1i、 并且在复制网络的二进制结构方面严重失败。这可以通过认识到边权重的连续性(可以在模型中取非负实值)表明生成零权重(即缺失链接)的概率为零而很容易证明。我们将在后面的文章中展示这个模型的预测结果,并与我们的结果进行比较。三、 作为ITN的GDP驱动模型,ECM最近被提议作为该网络的一个改进模型[36],这一挑战促使人们对ITN的拓扑结构和权重进行满意的建模。ECM专注于加权网络,可以同时执行度和强度顺序[33]。它建立在所谓的广义玻色-费米分布的基础上,这种广义玻色-费米分布最初是作为具有耦合二进制和加权约束的网络的零模型引入的[35]。在ECM中,度和强度序列可以通过写入以下哈密顿量来约束:H(W)=NXi=1[αiki(W)+βisi(W)](8),其中强度序列定义为si(W)=PNj6=iwij, 度序列为ki(W)=PNj6=iaij=PNj6=iΘ[wij], i、 因此,给定配置W的概率可以写成asP(W)=e-H(W)PWe-H(W)=Yi<j(xixj)aij(yiyj)wij(1)- yiyj)1- yiyj+xixjyiyj(9)与xi≡ E-阿兰·伊≡ E-βi。

14
大多数88 在职认证  发表于 2022-5-6 23:07:11
ECM给出了以下关于链路概率(haiji)和链路预期重量(hwiji)的预测:haiji=xixjyiyj1- yiyj+xixjyij=pij(10)hwiji=xixjyij(1)- yiyj+xixjyiyj)(1- yiyj)=pij1- 哎呀。(11) 根据文献[33]中提出的最大似然法,通过求解2N耦合方程组shki(W)i=NXj6=ipij=ki(W),可以在数值上找到未知量~x和~y的向量*)  i(12)hsi(W)i=NXj6=ihwiji=si(W)*)  i(13)并将指示为~x*还有~y*. 这些未知参数可以被视为适应性参数,它同时控制形成链路的概率和该链路的预期权重。ECM在各种现实网络中的应用表明,该模型能够准确再现这些网络的高阶经验特性[33]。特别是当应用于ITN时,ECM复制了二元和加权经验特性,用于不同的分解水平,并持续数年(暂时性的Napshots)[36]。事实上,在图3中,我们展示了2002年ITN快照的高阶二进制量(平均最近邻度和聚类系数)及其加权量(平均最近邻强度和加权聚类系数)。我们比较观察值(红点)和ECM预测的相应数量(蓝点)。附录中提供了所有这些量的数学表达式。我们发现数据和模型之间有很好的一致性,证实了[36]中我们在这里使用的数据集的最新结果。我们还证实,这些结果对于几个时间快照是稳健的[36]。A.

15
nandehutu2022 在职认证  发表于 2022-5-6 23:07:14
考虑到ECM的有希望的结果,我们现在向前迈出一步,检查隐藏变量Xiand和yi是否可以被认为是具有明确经济解释的“适应性”参数,它们有效地再现了观察到的ITN。这相当于检查上文g.2所示的纯二元情况下的关系是否可以推广,以便在一般加权情况下找到对抽象性参数的宏观解释。在图4中,我们展示了2002年快照中ITN每个国家的两个参数xiand Yid和重新调整的GDP(gi)之间的关系。我们发现这些数量之间有很强的相关性。fitness参数xit与经调整的GDP gi大致呈线性关系,由curvexi拟合=√a·gi(14)在哪里√a为固定常数,gi=GDPiPiGDPi(所有GDP s均与该特定年份相关)。应该注意的是,这种关系与BCM中ZI和GI之间的关系相似,如前所示,但不太准确。这一观察将在以后有用。相比之下,由于GDP是一个无界量,而适应性参数Yi在0和1之间有界(这是模型[33,35]的数学性质),因此Yi和GI之间的关系必然是高度非线性的。这种关系的一个简单函数形式是yi=b·gci1+b·gci。(15) 10-610-510-40.0010.010.10.0010.1gixi10-610-510-40.0010.010.1giyiH1 yiLFIG。4.计算出的xi(左面板)和yi1-yi(右图)与2002年快照中每个国家无向二元聚合ITN的gi(重新调整的GDP)进行了比较,其中线性fits(对数尺度)xi=√a·gi和Yi1-yi=b·gci(红线),其中a、b和c是每年固定的常数参数。的确如此。

16
能者818 在职认证  发表于 2022-5-6 23:07:17
4.确认上述表达式为数据提供了很好的拟合。我们检查了上述结果是否随着时间的推移系统地适用于我们数据集中ITN的每个快照。这意味着,在给定的年份中,我们可以插入等式。(14) (15)转化为等式。(10) 以及(11)获得当年ITN结构的GDP驱动模型。这样一个模型强调了GDP在塑造ITN的二元属性和加权属性方面的关键作用。虽然这是基于使用BCM和WCM(或相应的简化重力模型)分别获得的上述结果而预期的,但迄今为止,仍不可能找到适当的方法来明确地将这些结果结合到ITN的统一描述中。我们没有以上述形式更详细地探讨GDP驱动模型的预测,而是首先考虑一些因素,从而简化模型本身。B.简化的两步模型此时,应该注意,我们得出了两个看似矛盾的结果。我们发现,BCM和ECM都能很好地预测网络的二进制拓扑结构。然而,eqs。(4) 和(10),这两个模型的连接概率有显著差异。BCM和ECM在二进制水平上的可比性能(参见图1和图3)使我们预计,当特定值~z时*还有~x*被插入到等式中。(4) (10)尽管数学表达式不同,但两个模型中的连接概率值具有可比性。在图5中,我们比较了2002年快照中ITN的两种概率。请注意,每一点都是指在一对国家之间建立联系的可能性,其结果是inN(N-1) 要点。

17
mingdashike22 在职认证  发表于 2022-5-6 23:07:20
事实上,我们可以看到这些值沿着身份线分散,这证实了连接概率在两个模型中具有相似值的预期。上述结果使我们得以进行显著的简化。在eqs中。(10) 和(11),我们可以用公式(4)中BCM提供的表达式替换ECM提供的PIJ表达式。为了避免混淆,我们用ptsij表示newprobability,其中ts代表“两步”,原因马上就会清楚。这将导致预期网络属性的以下等式:haijits=zizj1+zizj≡ ptsij,(16)hwijits=ptsij1- 哎呀。(17) 其中,zi和ptsij仅取决于等式(5)中的度数,而yi和hwijits则取决于强度和等式中的度数。(12) 和(13)。在这个简化模型中,连接概率(它完全指定了网络集合的拓扑结构)不再像ECM中那样依赖于强度,而权重仍然依赖于强度。这意味着我们可以通过两步程序指定模型,首先通过度数求解确定PTSIJ的N方程,然后确定0。00.20.40.60.81.00.00.20.40.60.81.0pijBCMpijECMFIG。5.在ECM pijECM中形成链路的概率,与2002年快照中无向二进制聚合ITN在BCM pijBCM中形成链路的概率相比。红线表示身份线。其余的变量通过ECM确定。因此,我们将该模型表示为两步(TS)模型。配置W readsPts(W)=Yi<jqtsij(wij)(18)的概率,其中qtsij(wij)=(zizj)aij(yiyj)wij-aij(1)- yiyj)aij1+zizj(19)是权重链接连接节点(国家)i和j的概率。上述概率具有与原始ECM中相同的一般表达式[33],但这里zij来自于对更简单BCM的估计。

18
能者818 在职认证  发表于 2022-5-6 23:07:24
重写(19)asqtsij(0)=1+zizj=(1)是有指导意义的- ptsij);(20) qtsij(w)=ptsij(yiyj)w-1(1 - yiyj), w>0(21)以突出显示创建每个链接的随机过程。作为第一步,我们要确定链接是否以概率ptsij创建。如果确实建立了(单位重量的)链路,则第二次尝试确定相同链路的重量是否增加了另一个单位(概率为yiyj),或者过程是否停止(概率为1)- yiyj)。通过迭代该过程,在节点i和jis之间建立权重为w的边的概率由等式(21)中的qtsij(w)精确给出。然后正确检索预期重量Hwijits+∞w=0w·qtsij(w)。使用等式中的关系。(6) 和(15),我们可以将GIA和适应性参数输入等式。(16) (17)得到以下表达式,从数学上描述TS模型的GDP驱动规格:haijits=agigj1+agigj≡ ptsij(22)hwijits=ptsij(1+bgci)(1+bgcj)(1+bgci+bgcj)。(23)上述方程式可用于逆转目前使用的方法:我们现在可以利用所有国家的GDP知识,获得一个仅依赖于三个参数a、b、b的模型,而不是使用ECM(~x和~y)或TS模型(~z和~y)的2N自由参数来根据度和强度的观测值对模型进行拟合,c.可以使用两种技术为这些参数赋值:似然函数最大化和非线性曲线拟合。由于该模型是一个两步模型,我们可以首先为参数a赋值,并且只有在第二步(一旦a被设置)中,我们才确定参数b和c。我们选择通过最大化似然函数来确定a[37],这会限制预期的链接数与观察到的数量(hLi=L),如[6]所示。

19
可人4 在职认证  发表于 2022-5-6 23:07:27
确定b和c的值稍微复杂一些。由于模型使用TS模型的近似表达式,而不是原始ECM模型的近似表达式,kknn、Xknn\\0.60.70.80.91.01.1kc、Xc\\1\'1075\'1062\'1062\'1073\'1063\'1071.5\'1077\'106ssnn、Xsnn\\1\'1045\'1041\'105scW、XcW\\图6。比较2002年聚合ITN的观测特性(红点)、GDP驱动的两步模型(蓝点)和GDP驱动的WCM模型(绿点)的相应集合平均值。左上角:平均最近邻度KNI与度ki。右上角:二元聚类系数与度ki。左下角:平均最近邻强度snnivs强度si。右下角:加权聚类系数CwiversusSi。在第二步中最大化似然函数不再产生所需条件hT i=T,其中T是网络中的总强度。同样,如图4所示,从网络中提取参数并不能维持网络中的总强度。在没有任何先验偏好的情况下,我们选择了后一种方法,因为它相对于前一种方法在数值上相对简单。在图6中,我们展示了2002年ITN的高阶观测属性与GDP驱动的TS模型预测的预期属性之间的比较。附录中再次提供了这些特性的数学表达式。作为基线比较,我们还展示了GDP驱动的WCM模型的预测,其具有等式(7)[18]所述的连续权重,这与我们提到的重力模型的简化版本一致。我们发现GDP驱动的TS模型很好地再现了经验趋势。当然,正如预期的那样,fig.6中的预测(仅使用三个自由参数)比fig.3中的预测(使用2N个自由参数)噪音更大。

20
mingdashike22 在职认证  发表于 2022-5-6 23:07:30
这是由于eqs。(6) (15)描述拟合曲线,而不是精确的关系。重要的是,我们的模型在复制二进制和加权属性方面的表现明显优于WCM/重力模型。同样,这些模型的缺点在于,它们预测了一个完全连通的拓扑和一个相对同质的网络。还应注意的是,我们的模型预测的平均最近邻强度(snn)图相对于观测点略有偏移。这种影响是因为,正如我们所提到的,由于从ECM到TS模型的简化,总强度T(因此snn的平均趋势)仅由我们的模型近似再现。至于本文中的所有其他结果,我们检查了我们的发现在数据集的整个时间跨度内是稳健的。因此,我们得出结论,ECM模型及其简化的TS变量可以成功地转变为完全由GDP驱动的模型,同时再现ITN的拓扑结构和权重。TS模式的成功有一个重要的解释。回顾EQ。(16) 和(22),我们记得TS近似的效果是,连接概率ptsijc可以与权重hwijits分开估计,如果使用公式(16),则仅使用度序列的知识,如果使用公式(22),则使用GDP和链接总数,同时丢弃强度的知识。相比之下,不能单独进行预期权重的估计,因为它要求连接概率ptsijap出现在等式中。(17) (23)是首先估计的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-17 04:08