楼主: kedemingshi
2244 72

[量化金融] 时态多层网络中的社区检测及其应用 [推广有奖]

51
大多数88 在职认证  发表于 2022-5-7 07:19:24
存在ω>0,如果ω<ω,则|T |[s=1Cωmax | s∈ Cmax(0)。此外,我们还证明了ω=Q/2N(|T|- 1), 哪里Q是Q(Cmax | B,…,B | T | 0)和Q(C | B,…,B | T | 0)的第二大值之间的差异,通过设置cis+1=cis是无效的,因为缓慢地改变Pers(C)可以改变Pers+1或Pers(C)|-1.C.命题5.4的划分强化了将ω视为打破层内静态社区结构的成本,从而有利于跨层持久性的更大值的想法。它表明,层间耦合存在正值,因此对于任何较小的耦合,多层模块化最大化只提供了比单层模块化最大化更多的信息,因为它确定了具有最大持久性的分区集inCmax(0)。这一性质的证明依赖于一个事实,即给定模块化矩阵的可能模块化值集是有限的。证据设C是一个任意的分区∪|T | s=1C | s/∈ Cmax(0)。我们将证明层间耦合参数ω存在一个值ω,因此对于任何小于ω的层间耦合,C永远不是最优的。给定一系列单层模块化矩阵{B,…,B | T |},ω>0的一组可能的多层模块化值是有限的,由qω给出=Q(C | B,…,B | T |ω)|C∈ C,其中C是一个多层分区。设Q=max Q,Q=max Q\\{Q},和Q=Q- Q> 0。根据假设,Q(C | B,…,B | T | 0)<Q(Cmax | B,…,B | T | 0),其中Cmax∈ Cmax(0)。此外,通过对持久性的定义,它遵循Q(C | B,…,B | T |ω)≤ Q+2ωN(|T|- 1) (5.4)对于ω的所有值。通过选择ω<ω,ω=Q/2N(|T|- 1), 我们得到Q(C | B。

52
何人来此 在职认证  发表于 2022-5-7 07:19:27
,B | T |;ω) ≤ Q+2ωN(|T|- 1) <Q+Q=Q,所以对于ω以下的任何层间耦合,C都不是最优的。显然,ω=Q/2N(|T|- 1)不是集合的上限ω ∈ R+:S | T | S=1Cωmax | S∈ Cmax(0),但我们主要关心的是,这个集合的最小上界不是0。(事实上,我们已经证明,它必须至少与Q/2N(|T|- 1)> 0.)提案5.5。存在ω∞> 如果ω>ω∞, 然后Pers(Cωmax)|s=N表示所有的s∈ {1,…,T}。此外,我们还证明了ω∞= |T|N麦克斯(英国国际航空公司)-min(Bdiag)/其中max(Bdiag)=maxijsbijs,min(Bdiag)=minijsBijs。命题5.5意味着层间耦合ω的足够大的值可以保证Cωmax|在层间保持相同(命题5.3)。这个命题的证明类似于命题5.4的证明。例如,一个可以替换N(|T |- 1) in(5.4)由N(|T |- 1) - Pers(Cmax(0)),其中Pers(Cmax(0))表示通过组合Cmax(0)的每个分区中的集合而不改变在各个层上诱导的分区,可以获得的持久性的最大值。命题5。如果取ω=Q/N(| T |- 1) - Pers(Cmax(0)), 哪里Q/N(| T |- 1) -Pers(Cmax(0))> Q/2N(|T|- 1) ,因为Pers(Cmax(0))≥ |T|- 1在任何多层网络中。证据设C是多层网络的任意划分,使得Pers(C)|s<N对于某些s∈ {1,…,T}。我们证明了存在一个值ω∞> 层间耦合参数ω的0,使得对于ω>ω,C永远不是最优的∞. 我们首先重写质量函数asQ(C | B,…,B | T |ω)=β+2ω(N(| T |)- 1) - A) 式中,β=P | T | s=1PNi,j=1Bijsδ(cis,cjs)和A≥ 1因为Pers(C)<N(| T |- 1) 假设。现在考虑多层模型矩阵B:Bdiag的对角块上的一组值=Bijs | i,j∈ {1,…,N},s∈ {1, . . .

53
kedemingshi 在职认证  发表于 2022-5-7 07:19:30
,|T |},让max(Bdiag)和min(Bdiag)分别表示集合Bdiag的最大值和最小值。在不丧失一般性的情况下,我们假设最小值(Bdiag)<0,最大值(Bdiag)>0。设Cbe为具有最大持久性的任意多层分区。因此q(C | B,…,B | T |ω)=β+2ωN(|T |- 1) 有一段时间∈ R.因为≥ 1,选择2ω>|T |N麦克斯(英国国际航空公司)- min(Bdiag)≥ β- 对于任何β和所有a,β确保Cyields的多层模块化值大于C∈ {1,…,N(|T|- 1)}.以下命题直接来自命题5.5。提议5.6。存在ω∞> 这样的话对所有人来说∈ {1,…,|T |},Cωmax |是maxC的一个解∈CQC | T | Xs=1Bs对于所有的ω>ω∞.命题5.5和命题5.6暗示ω存在一个“边值”,在该边值之上,由最优多层划分(1)产生的单层划分是所有层上的相同点,(2)是定义在平均模块化矩阵上的单层模块化最大化问题的最优解。证据假设ω>ω∞, ω在哪里∞如命题5.5所定义,设Cωmax∈Cmax(ω)。根据命题5.5,Pers(Cωmax)=N(|T |- 1) ,和社区分配如果min(Bdiag)和max(Bdiag)有相同的符号,那么B的每个对角线块要么有所有的正条目,要么有所有的负条目。在这两种情况下,最优划分Cωmax对于ω>0的任何值都具有最大持续性,因为Cωmax |是由单个社区或所有s的单个社区给出的。因此,根据命题5.3,Cωmax中所有s的Pers(Cωmax)| s=N在各层中是相同的。

54
可人4 在职认证  发表于 2022-5-7 07:19:35
因此,对于ω>ω∞C*= argmaxC∈C|T | Xs=1NXi,jBijsδ(cis,cjs)+2ΩPers(C),<=> C*= argmaxC∈C|T | Xs=1NXi,j=1Bijsδ(ci,cj)+2ωN(|T |- 1),<=> C*= argmaxC∈CNXi,j | T | Xs=1Bijs!δ(ci,cj),其中cidenotes表示所有层中节点i的社区分配。接下来的两个命题形式化了一种直觉,即最优多层划分衡量层内静态社区结构(即层内模块化)和跨层社区结构持久性之间的权衡。提议5.7。设ω>ω>0。对于所有的Cωmax∈ Cmax(ω),以下两个条件之一必须成立:(1)Cωmax∈ Cmax(ω),或(2)Pers(Cωmax)<Pers(Cωmax),用于所有Cωmax∈ Cmax(ω)。证据设Cωmax∈ Cmax(ω)。如果Cωmax∈ Cmax(ω),则条件(1)满足。假设Cωmax/∈ Cmax(ω),并假设Pers(Cωmax)≥ 对于某些Cωmax,Pers(Cωmax)∈Cmax(ω)。根据最优性的定义,Cωmax/∈ Cmax(ω)意味着Q(Cωmax | B,…,B | T |ω)<Q(Cωmax | B,…,B | T |ω),(5.5),其中ω>ω。通过写q(Cωkmax | B,…,B | T |ωk)=T | Xs=1NXi,j=1Bijsδ(Cωkis,Cωkjs)+2ωkPers(Cωkmax),其中Cωkis是节点isin Cωkmax和k的社区分配∈ {1, 2}; 用ω+代替ω 对一些人来说 > 0,我们可以证明不等式(5.5)意味着Q(Cωmax | B,…,B | T |ω)<Q(Cωmax | B,…,B | T |ω),这与Cωmax的最优性相矛盾。提议5.8。设ω>ω>0。对于所有的Cωmax∈ Cmax(ω),以下两个条件之一必须成立:(1)Cωmax∈ Cmax(ω),或(2)Q(Cωmax | B,…,B | T | 0)>Q(Cωmax | B,…,B | T | 0)对于所有Cωmax∈ Cmax(ω)。证据设Cωmax∈ Cmax(ω)。如果Cωmax∈ Cmax(ω),则条件(1)满足。假设Cωmax/∈ Cmax(ω),并假设q(Cωmax | B,…,B | T | 0)≤ 对于某些Cωmax,Q(Cωmax | B,…,B | T | 0)(5.6)∈ Cmax(ω)。根据最优性的定义,Cωmax/∈ Cmax(ω)意味着Q(Cωmax | B。

55
大多数88 在职认证  发表于 2022-5-7 07:19:38
B | T |;ω) <Q(Cωmax | B,…,B | T |ω),(5.7),其中ω>ω。通过写Q(Cωkmax | B,…,B | T |ω)=Q(Cωkmax | B,…,B | T | 0)+2ωPers(Cωkmax),其中k∈ {1,2}通过使用(5.6),我们可以证明(5.7)意味着Q(Cωmax | B,…,B | T |ω)<Q(Cωmax | B,…,B | T |ω)。对于所有ω<ω。这与Cωmax的最优性相矛盾。为了发展命题5.7和5.8的直觉,有必要将给定分区C的多层质量函数Q(C | B,…,B | T |ω)视为ω的线性函数,在Q(C | B,…,B | T | 0)处与斜率Pers(C)相交(例如,参见图5.1和图5.2的最后几幅)。接下来的三个推论直接来自命题5.7和命题5.8。第一种说法是,在给定层间耦合值的情况下获得的最优分区的最大持久性值是ω的非递减函数。第二种说法是,在给定层间耦合值的情况下,非最优划分的层内模性可达到的最大值是ω的非递增函数。第三个性质表明,如果ω的两个不同值具有相同的最优划分集,那么该集对于所有中间值也是最优的。推论5.9。设ω>ω>0。它遵循thatPers(Cmax(ω))≥ Pers(Cmax(ω)),其中Pers(Cmax(ω)):=maxPers(Cωmax),Cωmax∈ Cmax(ω).推论5.10。设ω>ω>0。因此q(Cmax(ω))|B,B | T |;0) ≤ Q(Cmax(ω))|B,B | T |;0),其中Q(Cmax(ω)|B,B | T |;0):=maxQ(Cωmax | B,…,B | T | 0),Cωmax∈ Cmax(ω).推论5.11。假设对于ω>ω>0,Cmax(ω)=Cmax(ω)。

56
能者818 在职认证  发表于 2022-5-7 07:19:41
因此,对于所有ω,Cmax(ω)=Cmax(ω)=Cmax(ω)∈ (ω, ω) .我们可以扩展命题5.1–5.8的证明,使其适用于每对相邻层之间均匀的层间耦合,但可能会在后处理层节点之前进行多层划分,在后处理层节点之后进行多层划分。5.3. 通过社区分配交换(community assignment Swap,增加持久性的价值,但不改变层内分区)来增加多层模块化,从而说明后处理对多层分区的影响。面板(a)-(c)中的颜色与邻接矩阵的条目成比例。面板(d)(分别为面板(e))表示在后处理之前(分别为之后)使用Louvain获得的输出多层分区。横轴代表层,纵轴代表节点。面板(d,e)中的阴影表示每个层中节点的社区分配。从一对到另一对。换句话说,对于最大化问题maxC,可以得到类似的结果∈C|T | Xs=1NXi,j=1Bijsδ(cis,cjs)+2 |T|-1Xs=1ωsPers(C)|s.命题5.1–5.6很容易扩展到这种情况,我们可以扩展命题5。7–5.8如果(例如)一个人假设ω(1)s>ω(2)s>0表示所有s∈ {1,…,T |- 1} 式中ω(1)和ω(2)是(|T |- 1) -维度向量。(例如,可以设置ω(2)=ω(1)并改变ω>0。)5.3. 计算问题。现在,我们将研究使用Louvain启发式(见第2.2节)最大化多层模块化(3.3)时可能出现的问题。5.3.1。不重视坚持。考虑图5.3中的示例网络,它是一个三层网络,每层有5个节点。

57
nandehutu2022 在职认证  发表于 2022-5-7 07:19:45
假设在第1层和第3层中,所有节点都彼此紧密连接,并且当s=1,3时,第2层中节点1和节点{2,3,4,5}之间的边权重小于节点1和节点{2s,3s,4s,5s}之间的边权重。我们使用γ=0.5且ω=0.1的均匀网络。这将生成一个多层模块化矩阵,其中除节点1的模块化条目外,所有单层模块化条目均为正值,并超过层间耦合的值。假设在Louvain启发式的第1阶段中,一个循环位于从1到N | T |的顺序节点上。初始分区由N | T |个单件组成,然后将每个节点移动到最大程度增加模块性的集合中。第一阶段结束时的分区是{1,2,3,4,5,1},{2,3,4,5},{1,2,3,4,5}。在第二阶段,第二个和第三个集合合并形成一个集合,Louvain启发式陷入局部最优,其中较小的节点集(即{1})在第1层和第2层保持在同一个社区中,较大的节点集(即{2,3,4,5})改变社区。我们在图5.3(d)中展示了这种多层划分。在Louvain启发式第1阶段的每次迭代开始时,使用随机节点顺序重复该实验1000次,得到相同的多层划分。通过增加跨层持久性的值,而不改变层内分区(我们在命题5.1的证明中使用了这个想法),可以修改这个多层分区,以获得具有更大多层模块性值的新分区。我们在图5.3(e)中展示了这种情况的一个例子。在图5.3(d)中,我们通过层间颜色的突然变化直观地说明了上述问题。

58
何人来此 在职认证  发表于 2022-5-7 07:19:48
(这些在更大的网络中更为明显。)这种变化是误导性的,因为它们意味着持久性的大幅下降,而这可能与层内分区的显著变化无关。例如,在图5.3(d)中,层内分区在仅单个节点的社区分配中不同。为了缓解这个问题,我们对所有outputpartitions应用了一个后处理功能,该功能可以最大限度地提高层间的持久性,而无需更改每层上产生的分区。因此,我们产生了一个具有更大多层模块化值的分区。在我们的后处理中,我们重新标记了每一层中节点的社区分配,以便(1)最大化连续层之间保持相同社区的节点数量,(2)原始多层分区在每一层上诱导的分区保持不变。通过将给定层内分区集的持久性最大化问题重新表述为连续层之间的加权二部匹配问题,可以使用匈牙利算法[20,40,51]实现我们的后处理过程。层内合并的数量突然下降。Louvainheristic在多层网络中面临第二个问题。当层间耦合的值满足ω>max(Bdiag),(5.8)时,其中Bdiag是方程(5.4)中定义的B的对角块上的值集,层间对多层模块化的贡献大于所有节点对的层内贡献。因此,在Louvain启发式第一阶段的首次完成期间,仅发生层间合并。在图5.4(a)中,我们使用MultiAssetClasses数据集说明了这种现象。层间合并的平均数量从大约N=98(几乎每个节点都包含至少一个来自其社区中同一层的其他节点)下降到0。

59
可人4 在职认证  发表于 2022-5-7 07:19:52
对于大于max(Bdiag)的ω值,在第一阶段结束时的每个集合只包含不同层中每个节点的副本,尤其不包含来自同一层的节点。这会在输出多层分区的各个层上引起分区的突然变化。在图5.4(c)中,我们展示了一个使用MultiAssetClasses数据集的示例,说明了上述问题如何导致从Louvain启发式获得的多层输出分区计算出的定量测量值发生突变。我们注意到,将第一个和第二个集合合并成一个集合会降低模块性,因为层间耦合的值太小,无法补偿层内模块性贡献的减少。0.1 0.3 0.5 0.7 0.9050100#-层合并ω(a)Louvain0第一阶段第一次完成后层内合并的平均数量。1 0.3 0.5 0.7 0.9050100#-层合并ω(b)Louvainr第一阶段第一次完成后的层内合并平均数(c)Louvain输出分区中改变层间社区分配的节点平均数(d)Louvainr输出分区中改变层间社区分配的节点平均数图。5.4. Louvain和LouvainRand算法之间的比较。层间耦合值的样本是集合{0,0.02,…,0.98,1},每个连续值之间的离散化步骤为0.02。(a,b)在(a)Louvain启发式和(b)LouvainRand启发式的第一阶段完成后,与同一层中至少一个节点合并的第九个节点的数量。对于每个启发式,我们平均nintraover | T |=238层和100次迭代。面板(a、b)中的误差条表示标准偏差。

60
能者818 在职认证  发表于 2022-5-7 07:19:55
(c,d)1的价值- Pers(C)| s/N平均超过100次(C)Louvain启发式和(d)Louvainr启发式,在算法收敛到局部最优后。在ω>最大值(Bdiag)的Louvain算法第1阶段第一次完成后,集合的平均大小(平均超过100次)对于多组分类而言相对较小。(平均值为每个集合3个节点,节点集的最大可能数量为| T |=238,因为当ω>max(Bdiag)时,这些集合中的每个集合只包含相同节点的副本。)然而,当ω增加超过ω=max(Bdiag)时,(1)的值会有一定的下降- ω=max(Bdiag)时输出分区中连续层之间的Pers(C)| s/N)[见图5.4(C)]。(1)的非零值-Pers(C)| s/N)表明,在s层和s+1层之间,社区分配发生了变化(根据命题5.3)。粗略地说,图5.4(c)表明,当ω>max(Bdiag)时,人们会突然远离ω≈ ω到更接近ω的场景≈ ω∞.当层间耦合的值相对于Bdiag的条目较大时,上述现象就表现出来。在我们考虑的相关多层网络中(或在未加权多层网络中),邻接矩阵的条目满足| Aijs |≤ 1.假设在另一种情况下,随着ω的增加,会发生突变,则在每种情况下使用模块化质量函数,参见参考文献[63]中关于多层拉普拉斯算子特征值变化作为ω函数的讨论。图层和那个精灵≥ 0(例如,Pijs=hAsi),这意味着max(Bdiag)≤ 所有人1人∈ [γ-, γ+] .对于那些为了持久性而改变层内分区的模块化成本比Bdiag的值大的网络,可能需要使用ω>1来深入了解多层社区结构。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 10:09