楼主: kedemingshi
2865 114

[量化金融] 网络重构方法:经济与金融案例 [推广有奖]

11
可人4 在职认证  发表于 2022-6-10 04:39:47
当可用信息有限时,这一点尤其重要,并构成了确定无统计基础网络重建算法确实可以成功的物理原因。通过使用这种“对称性”,可以提供一些可能的缺失估计。在这些情况下,人们通常更感兴趣的是从局部信息重建单个链接,这是一个称为“链接预测”的问题【62,63】。正在分析的网络数量。显然,虽然同质性假设最小化了通过采用可用信息不支持的任意假设(原则上不稳定)引入的偏差,但它也限制了真实网络重构的准确性,相反,真实网络显示出强烈的结构异质性。鉴于这些前提,熵最大化提供了所有已审查方法的统一概念。事实上,熵最大化是一种普遍存在的规定,用于获得与某些强制约束一致的最小偏差概率分布(即,概率分布不编码约束本身所表示的信息以外的其他信息[65,66])。这一原则不仅在统计力学、信息论和统计学中有着数百种应用【67】,而且还被认为代表了失衡系统的进化驱动【68】(例如,有人提出了智能系统动力学与熵最大化之间的关系【69】)。本报告概述如下。在第2节“信息论作为网络重构的基础”中,我们介绍了可以从统计物理和信息论的经典方法中衍生出来的工具,主要是吉布斯的集合理论、香农关于熵的著作和杰因斯对统计力学的解释。

12
何人来此 在职认证  发表于 2022-6-10 04:39:51
从这些理论前提出发,在第3节“重建方法”中,我们对不同的重建方法进行了概述,将其分为a)密集重建方法、b)密度可调重建方法、c)精确密度方法、d)替代方法。在第4节,测试网络重建中,我们详细介绍了一些指标和量度,可用于测试已实现重建的准确性;更具体地说,我们区分了统计、拓扑和动态三类指标,分别旨在测试重构微观细节、宏观拓扑特征和给定网络动态特性的准确性。关于动力学指标,我们特别强调评估系统在冲击传播过程中的弹性的可能性。在金融环境中,这被称为系统性风险,即给定金融网络的一致部分可能因局部故障而崩溃(gobankrupt)的可能性。在第5节“模型选择标准”中,我们描述了一些现有标准,以比较不同的模型以及如何选择最合适模型的相应配方。本报告以第6节“结论和展望”结尾,在这里我们描述了所述算法未来可能的应用。作为一般性的评论,我们想强调的是,几乎每一篇本文都有自己的命名(通常相似)感兴趣的数量。由于我们希望在一个统一的框架内展示不同的贡献,我们的展示可能无法反映结果的原始推导。2、信息理论作为网络重构的基础信息理论为我们的形式主义提供了理论基础[70]。

13
何人来此 在职认证  发表于 2022-6-10 04:39:54
信息的概念在网络重构中起着基础性的作用,因为重构网络最终意味着优化利用可用的部分信息。否则,我们的任务是从可用数据中尽可能推断出分析中的系统,同时限制不支持的假设的数量。如前所述,真实数据往往是不完整的:因此,任何数据驱动的推断程序都必须考虑一组更大的合理配置,即所有与可用信息兼容的配置。在统计力学的语言中,这个集合被称为集合。扩大允许的配置集,进而增加实际配置的不确定性;因此,描述必然具有概率性:必须为与已知信息兼容的每个配置(即属于集合的所有配置)分配一个概率值。给定配置的可信程度可以通过描述惊喜的概念来明确量化。因为一个“令人惊讶的”事件(被认为是极不可能的)被认为传递了大量的信息[65]。对风险的有效定义应与所考虑事件的实现概率进行(负)相关编码。

14
可人4 在职认证  发表于 2022-6-10 04:39:57
因此,在可能结果集G中,给定结果G的信息内容可以量化为asI(G)=-在P(G),(1)一个定义中,指出某个确定的事件(即以P(G)=1为特征)的发生不会带来任何信息,也不会带来任何意外,而(几乎)不可能的事件(即以P(G)为特征)的发生传递(几乎)有限的信息,并导致(几乎)“有限”的意外【65】。然后,可以通过对集合本身进行平均来量化属于集合G的事件所伴随的平均惊讶程度。这样的操作导致香农熵的基本概念:S=hIi=XG∈GP(G)I(G)=XG∈G-P(G)ln P(G)。(2) 等式(2)的另一种解释来自信息论[71,72]。给定要通过信道传输的符号(作为一种语言)列表,应为频率较高的符号分配较短的代码,而频率较低的符号应使用较长的代码(见附录a)。查找传输给定消息所需的平均代码长度也会导致S。从公理化的角度来看,香农熵是唯一满足香农-钦钦公理(Shannon-Khinchin axioms)[66]:1所述许多性质的函数。香农熵是其所有参数的连续函数:这确保了概率分布P(G)的小变形δP(G)引起S的小变化;2、香农熵在一组可能的配置上对应均匀分布达到最大值;3、香农熵在零概率事件的加法下是不变的;4.

15
kedemingshi 在职认证  发表于 2022-6-10 04:40:00
对于由两个独立的子系统a和B组成的系统,其可能的组合Ga和Gb具有概率度量WA和WB,熵是相加的:S(WA+B)=S(WAWB)=S(WAWB)+S(WB),即整个系统的熵是两个子系统熵的总和。在[73]中,这一公理被所谓的“合成定律”所取代。另一方面,如果两个子系统不独立,则S(WA+B)=S(WA)+S(WB | A),WB |表示子系统B配置的概率度量,以子系统A的实现为条件。换句话说,香农熵是随机变量任意集概率分布的函数(在我们的例子中,上述集合G中的配置G),并量化分布本身的(un)均匀性【74】。例如,如果没有关于系统的信息可用,则其不确定性最大,香农熵规定在G上分配一个均匀分布。反过来,系统上获得的任何统计信息都会降低概率分布的均匀性,概率分布在传递给定信息的配置的对应关系中逐渐达到峰值。2.1. 设置问题:约束Shannon entropyE。T、 Jaynes首先指出了使用香农熵定义一个级别推理程序的可能性【73】,在统计力学的背景下扩展了Gibbs提出的方法。Jaynes建议对汉农熵进行有约束的最大化,即最大化泛函ll[P]=S- λ“XG∈总成(G)- 1#-MXm=1λm“XG∈总成(克)厘米(克)-hCmi#,(3)M个量{Cm(G)}Mm=1,总结了系统的可用知识,作为概率分布P(G)本身满足的约束条件。

16
大多数88 在职认证  发表于 2022-6-10 04:40:03
最大化香农熵可确保我们对要重建的系统的无知达到最大程度,但已知的情况除外,或等效地,关于系统本身的不合理假设的数量最小化。事实上,可以证明,最大化香农熵的概率分布对于未知信息而言是最大不可承诺的[73](见附录B)。由于约束香农熵最大化代表了一种关于未知信息的“猜测”过程,其特点是统计偏差最小,因此可以将其视为拉普拉斯不充分理性原理的更新版本【73】。后者指出,在缺乏有关所分析系统的任何信息的情况下,没有理由偏好任何特定配置,因此,该配置与任何其他配置具有同等的可能性。这一原理只不过是等式(3)的一个特例,没有约束,只有归一化条件,它实际上导致在集合P(G)=| G |上均匀分布,G∈ G、 如前所述,香农熵在这种情况下达到最大。上述框架足够通用,可以分析物理系统和网络。在第一种情况下,M约束表示物理量(例如,系统的平均能量),而在第二种情况下,M约束表示节点度、网络互易性等纯拓扑量。我们还想强调,吉布斯-杰因斯方法最初是在平衡统计力学领域内定义的,这也是指导其应用于网络的精神。然而,一般来说,网络不满足热力学系统有效的平衡条件。

17
能者818 在职认证  发表于 2022-6-10 04:40:06
因此,在网络领域,采用熵最大化方法从低阶约束中重建高阶统计特性,是因为对网络结构的任意统计假设的最小化,而这些假设不受可用信息的支持。现在,让我们明确地将G视为所有可能的网络配置(具有N个顶点)的集合。在大多数情况下,我们考虑既有权又有向的网络,这意味着表征它们的互连可以用具有实数项的非对称N×N矩阵来表示:W=ww1i。w1N。。。。。。。。。。。。。。。wi1。wii。赢wN1。wNi。wNN公司(4) wij在哪里≥ 0表示从节点i到节点j的链路的权重。矩阵W导出第二个矩阵A,称为网络的邻接矩阵。形式上,如果wij>0,则genericelement aijof A等于1,否则等于0。换句话说,矩阵a简单地指示节点对之间是否存在连接。每当经验网络W的权重不能直接观察到,而只能访问网络上的聚合(边缘)信息时,就会出现网络重构问题。更准确地说,通常只知道行和/或列的总和:^souti=PNj=1^wij(外强度)^sini=PNj=1^wji(内强度) i、 (5)注意,每个节点i的^A的行和列之和,即out degree^kouti=PNj=1^aijandin degree^kini=PNj=1^ajio通常是未知的。在金融背景下,^W通常代表银行间风险敞口矩阵,也称为负债矩阵。该矩阵的条目^wijo是受隐私问题保护的银行间贷款和借款,而边缘部分是公开发布的不平衡表。

18
mingdashike22 在职认证  发表于 2022-6-10 04:40:09
^soutithen量化节点i的银行间资产总额,并量化其银行间负债总额(见第4.3.1节)。另一个经典的例子是世界贸易网络(WTN),其中这些数量代表国家的总进出口。一般来说,任何旨在重建加权有向网络的算法都会输出两个矩阵,P={pij}Ni,j=1和W={wij}Ni,j=1:虽然第一个矩阵的通用条目pijo描述了任意两个节点i和j连接的概率,但第二个矩阵的通用条目提供了相应链接的权重wijo的估计。我们可以说,在某些条件下,本综述中考虑的方法的概率和权重估计是可访问信息的函数,通常可以写成pij(^souti,^sinj)和wij(^souti,^sinj)。因此,条目AIJC可以解释为伯努利变量,该变量为1,概率为一定的Pijan,否则为0。由于在我们这里考虑的情况下,可用数据的数量是O(N)(如果已知onlyout和in强度,则为2N),因此重建实数邻接矩阵的问题是不确定的。在接下来的内容中,我们将回顾采用概率方法来解决此类问题的方法,利用在前一小节介绍的信息理论框架内开发的工具和概念。2.2. 指数随机图指数随机图(ERG)[55,59]在大多数网络重建算法中占据中心地位。实际上,ERG被定义为图的集合,其概率P(G)是通过最大化等式(3)的约束熵泛函获得的。

19
何人来此 在职认证  发表于 2022-6-10 04:40:12
更具体地说,求解函数微分方程δL[P]δP(G)=0与P(G)相关,得出以下公式:P(G | ~λ)=e-1.-λ-PMm=1λmCm(G)(6),描述了所有可能网络配置在集合G上的指数分布(形式主义的名称)。请注意,系数{λm}Mm=0除式(3)中的拉格朗日乘子外,其他都是,其值由一组方程sxg固定∈GP(G | ~λ)Cm(G)=hCmi(7)m=0。M,其中C(G)=1设置归一化条件1+λ≡ Z(~λ)=XG∈通用电气-PMm=1λmCm(G)。(8) 利用上述关系,我们可以消除λ,得到类似于正则系综不稳定物理的ERG概率分布的标准表达式:P(G | ~λ)=e-PMm=1λmCm(G)Z(~λ)。(9) 指数处的量H(G | ~λ)=PMm=1λmCm(G)称为图哈密顿量,Z(~λ)=PG∈通用电气-PMm=1λmCm(G)是配分函数,它使概率分布适当正规化。可以很容易地证明,式(6)不仅使L[P]的第一个函数导数消失,而且使二阶导数δL[P]δP(G)δP(G)负定义,因此P(G)确实是L[P]的最大值(见附录C)。ERG形式主义可以有效地用于分析现实世界的网络,假设给定的观测配置^G是从G中提取的,因此可以一致地分配概率系数P(^G | ~λ)。然而,我们仍然需要一个倒数来设置平均值{hCmi}Mm=1,或者等效地,拉格朗日乘数{λm}Mm=1,以最佳方式。为此,我们可以调用最大似然原理,规定将P(^G | ~λ)最大化为~λ的函数,或等效的对数似然函数l(^G | ~λ)=ln P(^G | ~λ)=-MXm=1λmCm(^G)-ln Z(~λ)。(10) 使用等式。

20
kedemingshi 在职认证  发表于 2022-6-10 04:40:15
(7) 和(9),可以表明值集{λm}Mm=1满足方程组L(^G | ~λ)λm=0,m=1。M是指确保HCMI=^Cm(11)的值m=1。M、 也就是说,约束的整体平均值与^G[58]中给出的值相匹配。值得注意的是,可能性最大化始终规定,唯一可用于进行推理的信息是我们可以访问的信息。此外,很容易证明,相同的选择使得L(^G | ~λ)的Hessian负定义,这意味着等式(11)中的位置对应于最大可能性。因此,整个ERG配方可以总结为结合了两个优化原则:o熵最大化,它确保导出的概率分布仅编码来自所选约束的信息;o似然最大化,保证施加约束的值与观察到的值相匹配,没有任何统计偏差。在下文中,我们将详细介绍各种网络重建方法。然而,请注意,一般来说,ERG形式主义也可以用于第二个目的,即分析已知的真实网络,以检测影响其拓扑结构的随机性水平。实际上,假设有一个结构完全已知的经验网络^G。然后,我们可以问这个网络是否是一个特定ERG的“典型”配置,该配置来自于施加一组网络可观测值{Cm(^G)}Mm=1的随机集。换言之,我们可以检查网络^G是否“最大随机”——随机性水平由霍森约束确定,因此任何其他可观测网络带来的信息可以减少到约束中编码的信息。我们将在第4.2.3.3小节中简要讨论这种方法。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 08:09