楼主: kedemingshi
2244 72

[量化金融] 时态多层网络中的社区检测及其应用 [推广有奖]

31
可人4 在职认证  发表于 2022-5-7 07:18:19
NG null网络(2.8)和NGS null网络(2.13)之间的一个关键区别是,两个节点之间的预期边权重在前者中必须为正,但在后者中可能为负。考虑第4.1.1节中示例的一个有符号变量,其中类别内边缘权重等于常数a>0,类别间边缘权重等于常数b<0。κ-Th类节点i的强度为k+i=|κ| a和k-i=(N)- |κ|)b。我们考虑两类κ,κ有不同数量的节点。取|κ|>|κ|在不失去一般性的情况下,得出pi,j∈κ=2m+|κ| a-2米-(N)- |κ|)b>2米+|κa-2米-(N)- |κ|)b= 皮,j∈κ、 其中Pi,j∈κiis ngsnall网络中κii中节点对之间的预期边权重。与NG null网络的情况一样,NGSNLL网络中属于较大类别的节点对比属于较小类别的节点对具有更大的预期边权重。然而,预期的边缘权重可能是负的,这一事实可能会使多尺度社区结构的解释更加复杂。一类κ,其π,j∈κ<0和Pi∈κ、 j/∈κ≥ 当Aij<-γPijforall i,j∈ κ(对于足够大的γ,这个不等式必须成立,因为Pi,j∈κ<0),并且对于较大的γ值不会进一步分裂。这在用NGS网络获得的多尺度社区结构的解释中提出了一个特别的问题,因为具有负预期边权重的节点不需要在观察到的网络中“密集连接”才能对模块化做出积极贡献。事实上,如果放松对不同类别的边缘权重一致的假设,就可以确保类别内边缘权重最低的类别中的节点永远不会分裂。这与多尺度社区结构的标准解释背道而驰[41]。无花果。

32
可人4 在职认证  发表于 2022-5-7 07:18:22
4.1(d,e),我们用一个简单的例子来说明NGS空网络的上述特性。图4.1(d)中的玩具网络包含100个节点,分为三类:一类大小为50,两类大小为25。大小为50的类别和大小为25的一个类别在每对节点之间的类别内边缘权重为1。尺寸为25的另一个类别的每对节点之间的类别内边缘权重为0.4。所有类别间边的权重均为-0.05. (我们选择这些值,以便第三个类别的类别内预期边缘权重为负值,前两个类别的类别内预期边缘权重为正值,并且类别间预期边缘权重为正值。)我们在图4.1(e)中观察到,对于足够大的γ,第一类和第二类分裂为单态,对于较大的分辨率参数值,两类中较小的分裂为单态,而第三类从未分裂。我们对图4.1(f)中的U零网络进行了相同的实验(在使用Aij7将邻接矩阵线性移位到区间[0,1]之后)→(Aij+1)对于所有i和j),我们观察到节点的共分类指数反映了它们之间的边缘光的值。第一类和第二类的成对节点最大,第三类的成对节点最小。4.2. 数据集。我们将说明我们在第4节中讨论的功能是如何实现的。1可以在真实数据中显示。我们使用两组金融时间序列数据进行计算实验。第一个数据集,我们称之为多资产分类,有多种类型的资产,包括99年1月1日至10年1月1日期间N=98金融资产的周价格时间序列(每项资产的价格为574)。

33
大多数88 在职认证  发表于 2022-5-7 07:18:24
这些资产分为七个资产类别:20个政府债券指数(Gov.)、4个公司债券指数(Corp.)、28个股票指数(EQ.),15种货币(当前),9金属(金属),4燃料商品(Fue.),和18种商品。该数据集是在[24]中使用主成分分析进行研究的,该论文对金融资产进行了详细描述。第二个数据集,我们称之为SingleAssetClass,包括1999年1月1日至2013年1月1日期间标准普尔(s&P)1500指数中N=859金融资产的每日价格时间序列(每个资产组的价格为3673)。金融资产均为股票,分为十个部门:64种材料、141种工业、150种金融、142种信息技术、55种公用事业、47种主要消费品、138种非必需消费品、48种能源、68种医疗保健和6种电信服务。一个人选择计算一对时间序列之间的相似性度量的精确方式,以及他所做的后续选择(例如,均匀或非均匀窗口长度,以及重叠或不重叠(如果使用滚动时间窗口),会影响相似性度量的值。定义相似性度量的方法有很多,最佳选择取决于应用领域、时间序列解析等方面,这是一个活跃且有争议的研究领域[62,67,69,76]。从一组时间序列构建相似矩阵并进行调查我们考虑的节点少于1500个,因为我们只包括所有时间点上可用数据的节点,以避免与数据清理技术选择相关的问题。(a) 多资产类别:所有238个时间窗口的相关曲面图(b)单资产类别:所有854个时间窗口的相关曲面图0.1 0.2Fig。4.2.

34
mingdashike22 在职认证  发表于 2022-5-7 07:18:28
(a)多资产类别数据集和(b)单资产类别数据集在所有时间窗口的相关性曲面图。每个面板中的颜色根据观察到的频率值进行缩放。给定相似矩阵中的群落结构是两个独立的问题,本文主要研究后者。因此,在我们所有的实验中,我们使用皮尔逊相关系数来衡量相似性。我们使用一个滚动时间窗口来计算它们,该时间窗口具有统一的窗口长度和统一的重叠量。我们对两个数据集采用相同的网络表示。我们使用时间窗这个术语来表示一组离散的时间点,并将每个时间序列划分为重叠的时间窗,用T={Ts}表示。每个时间窗口的长度| T |以及连续时间窗口之间的重叠量|T |- δt是均匀的。重叠量决定了每个时间窗口中添加和删除的数据点的数量。因此,它确定了在每个后续相关矩阵(即每个后续层)中记录连接模式的数据点的数量。对于多资产类数据集(每个时间窗口中的数据约为两年),我们的Fix(|T |,δT)=(100,2),对于单资产类数据集(每个时间窗口中的数据约为一年),我们的Fix(|T |,δT)=(260,4)。具有邻接矩阵的每个网络层都是时间窗Ts期间对数回报时间序列之间的皮尔逊相关矩阵。我们采用对数回报之间的相关性,因为这是标准做法[17],但也可以检查其他数量之间的相关性(如算术回报[31])。对于每个数据集,我们研究矩阵序列像∈ [-1,1]N×N | s∈ {1,…,T}.我们展示了图中每个数据集在每一层中观察到的相关频率的表面图。

35
nandehutu2022 在职认证  发表于 2022-5-7 07:18:32
4.2.4.3. 资产关联网络中的多尺度社区结构。我们对两个数据集的相关矩阵进行与图4.1相同的实验。我们的分辨率参数样本是{γ-, . . . , γ+}(分别为,{0,…,γ+})对于离散步长为10阶的U和NG(分别为NGS)零网络-3.我们存储成对节点的联合分类索引20 40 60 8020406080(a)重新排序的关联矩阵20 40 60 8020406080(b)重新排序的多尺度关联矩阵20 40 60 8020406080(c)重新排序的多尺度关联矩阵20 40 60 8020406080(NG)20 40 60 8020406080(d)重新排序的多尺度关联矩阵10 20 30102030(e)重新排序的多尺度关联矩阵10 20 30102030(f)重新排序的多尺度关联矩阵关联矩阵(U)10 20 30102030(g)重新排序多尺度关联矩阵(NG)10 20 30102030(h)重新排序多尺度关联矩阵(NGS)0 0.5 1图。4.3. U、NG和NGS空网络的多尺度关联矩阵,以及多资产分类数据集最后一层中的关联矩阵子集。在图(a)中,我们展示了整个矩阵;在面板(b、c、d)中,我们展示了我们使用三个空网络中的每一个从该矩阵中获得的多尺度关联矩阵。在图(e)中,我们展示了图(a)中相关矩阵的前35×35块;在面板(f,g,h)中,我们展示了多尺度关联矩阵,我们使用三个空网络中的每一个,从相关矩阵的子集中获得。颜色根据多尺度关联的条目和相关矩阵的条目进行缩放。对角线上的黑色方块对应ZF和公司债券资产,白色方块对应股权资产。样本中所有分辨率参数值的平均值。我们将U和NGnull网络用于线性移位到区间[0,1]的相关矩阵。

36
nandehutu2022 在职认证  发表于 2022-5-7 07:18:35
对于每一个空网络,我们由此产生| T |多尺度关联矩阵,其中心在0到1之间,指示在分辨率参数值之间节点对处于同一社区的频率。我们在图4.3中展示了多资产类别特定层的多尺度关联矩阵。图4.3(a)中的矩阵对应于2008年2月8日至2010年12月1日期间的相关矩阵。与[24]中的结果一致,该矩阵反映了2008年莱曼破产后发生的金融资产与我们从早期计算的相关矩阵之间的相关性增加。(也可参见图4中的一个曲面。)图4.3(b、c、d)中的矩阵分别对应于U、NG和NGS空网络的多尺度关联矩阵。我们对所有矩阵(相同地)进行重新排序,使用节点排序,基于我们通过U空网络获得的分区,该网络强调相关矩阵中的块对角结构。我们观察到,与图4.3(c,d)中的多尺度关联矩阵相比,图4.3(b)中的多尺度关联矩阵中的共分类指数更好地反映了图4.3(a)中资产之间的关联强度。如图4.3(c,d)中左上角较深的红色阴影所示,我们还观察到,ZF和公司债券资产(我们在对角线上用黑色方框表示)处于02 04 06 08 100.40.60.81相关年(a)多资产分类数据集NGS01 03 05 07 09 11 130.20.40.60.81多尺度关联矩阵和相邻矩阵之间的相关年(b)多尺度关联矩阵和SingleAssetClass数据集图。4.4.

37
何人来此 在职认证  发表于 2022-5-7 07:18:38
所有时间层上U(实线曲线)、NG(虚线曲线)和NG(虚线曲线)空网络的邻接矩阵和多尺度关联矩阵之间的相关性(a)多类数据集和(b)单类数据集。我们计算每个矩阵中上对角线块中的项目之间的皮尔逊相关系数(避免重复计数,因为矩阵是对称的),并排除对角线项目(通过构造,这两个矩阵中的对角线项目等于1)。同一社区的分辨率参数值范围大于权益资产(我们用对角线上的白色方块表示)在同一社区中的范围。事实上,当我们使用NGS空网络时,两个ZF或公司债券之间的预期权重为负(大约为-0.1),对于任意大的分辨率参数值,这些资产位于同一社区中。(换句话说,他们不会为了大的利益而分裂成更小的社区。)在使用多尺度关联矩阵时需要谨慎。4.3(c,d)以了解图4.3(a)中资产之间的连通性。在研究多资产数据集的相关矩阵时,人们可能希望改变数据中包括的资产类别的大小(例如,通过改变股权和债券资产的比率)。我们将展示这样做如何导致进一步的误导性结论。通过仅使用相关矩阵的一个子集(前35个节点)重复相同的实验,我们考虑了一个例子,其中我们反转了债券资产类别和权益资产类别的相对大小。如图4.3(g,h)中右下角较深的红色所示,在使用NG或NGS网络时,权益资产现在比ZF和公司债券资产具有更大的分类指数。

38
nandehutu2022 在职认证  发表于 2022-5-7 07:18:41
如果使用图4.3(c,d)(分别为图4.3(g,h))的多尺度关联矩阵中的共分类指数来获得关于图4.3(a)(分别为图4.3(e))中权益和债券资产之间观察到的相关性的信息,则可能会得出不同的结论,尽管这些结论没有改变。然而,图4.3(f)中带有U零网络的多尺度关联矩阵反映了图4.3(e)中观察到的股权和债券资产之间的相关性。[72]的作者表明,一个称为“常数Potts模型”(CPM)的零网络的全局最优划分是“样本无关的”,其中边权重由一个与网络无关的常数给出。对于U型网络(其中预期的边权值为常数,但不独立于观测网络),其结果可概括如下。假设Cmax是一个最大化Q(C | a;P;γ)的分区,并考虑网络在一组社区C,氯∈ Cmax。然后{C∪C∪ Cl}最大化Q(C|^A;P;γ),其中^A是诱导子图γ=γhAi/h^Ai的邻接矩阵。对于CPM零网络,同样的结果适用于γ=γ。为了量化一个空网络的多尺度关联矩阵“反映”相关矩阵中的值的意义,我们计算U、NG和NGS空网络的每个多尺度关联矩阵的上三角部分与其对应的邻接矩阵在两个数据集的所有时间层之间的皮尔逊相关性。我们在图4.4中展示了这些相关图。观察图4.4(a,b)中邻接矩阵和多尺度关联矩阵之间的相关性,在U零网络的每一层中最强,在NGS零网络的每一层(几乎)中最弱。上述观察结果可以解释如下。

39
能者818 在职认证  发表于 2022-5-7 07:18:45
回想一下(2.5),我们可以把模块化最大化问题写成maxS∈STr(STB),其中S是划分矩阵的集合。当使用U型零网络时,模度矩阵的项是邻接矩阵的项被常数γhAi移位,质量函数减少为x∈sTr(STAS)- ||c(S)||, (4.2)其中| | c(S)| |=| | Tr(STNS)| |是以S为单位的集合大小向量的2-范数(即,c(S)是其kthentry isPNi=1Sik的向量)。因此,U零网络的模块化最大化等价于邻接矩阵的块对角化(第(4.2)项中的第一项),并对社区的大小(第二项)进行惩罚。随着分辨率参数的增加,人们倾向于使用内部连通性更强的较小节点集。注意,也可以将等式(4.2)应用于调整的邻接矩阵A=A-~A.例如,可以将~A设为控制相关矩阵A中随机波动的矩阵(例如,“随机分量”Crin[46])。对于一般的空网络,等式(4.2)采用formmaxS∈sTr(STAS)- Tr(ST(γP)S),其中P是零网络的邻接矩阵。也就是说,模块化最大化在一个(第一项)中找到块对角结构,而不是在γP(第二项)中。在应用程序中通常避免使用U null网络,因为“它不是大多数现实世界网络的良好表示”[53]。一个wantsa空网络在多大程度上能很好地代表一个观察到的网络,这取决于一个人想要将其视为给定的特性。我们认为,对于给定的情况,NG空网络是否比U空网络更合适,至少在一定程度上取决于一个人对该应用程序节点强度的解释。

40
能者818 在职认证  发表于 2022-5-7 07:18:48
正如我们在第2.4节中讨论的,相关矩阵中节点的强度由其标准化时间序列和平均时间序列之间的协方差给出。因此,当使用NGNULL网络时,两两差异会导致Bij- Bijin模块化质量函数依赖于corr(^zi,^zj)、corr(^zi,^zj)和corr(^zk,^ztot),其中k∈ {i,j,i,j},数量^zi是第2.4.1节中定义的资产的标准化时间序列,^ztot=PNi=1^zi。当使用U空网络时,模块化质量函数中的成对差异仅取决于观察到的边权重corr(^zi,^zj)和corr(^zi,^zj)。术语corr(^zk,^ztot)引入了使用NG空网络发现的社区之间的依赖关系,以及这些社区中的节点代表样本平均时间序列的程度[通过corr(^zk,^ztot)测量]。在可能希望使用varyone的节点样本的情况下(例如,通过改变资产类别的大小),在解释所获得的社区时,需要记住这些依赖性。5.多层隔板上层间耦合的影响。在第4节中,我们将多层网络中的层间连接权重设置为0。然后,多层模块化最大化问题(3.4)的解决方案仅取决于每个时间层的模块化矩阵中的值,多层模块化最大化问题简化为在每个层上独立执行单层模块化最大化。回想一下多层模块化最大化问题maxC∈C“|T | Xs=1NXi,j=1Bijsδ(cis,cjs)+2Ω|T|-1Xs=1NXi=1δ(cis,cis+1)#。这个问题的一个解决方案是对N | T |节点多层网络进行分区。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 14:17