楼主: mingdashike22
960 39

[量化金融] 股票网络的非线性 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-6-10 01:25:13
,N}表示为N乘以N矩阵,附加条形图显示表示各股票整体非线性的列和。然而,相关性和互信息估计都假设(至少在理论上)平稳性,因为这种非平稳性可能导致依赖性的虚假检测。基于此,我们建议从分析中删除此类强非平稳变量,或至少谨慎解释重非平稳数据的平稳估计结果。0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8归一化数据的相关系数r(xNi,xNj)0.00.20.40.60.81.0归一化数据I(xNi,xNj)的互信息图5:单变量归一化原始数据的相关性和互信息估计之间的关系。所选数据点对应于黑色最大表观非线性(AIG)股票。可视化如图1.2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 201402505007501000AIGIF所示。6: 具有最强明显非线性的股票的调整收盘价:AIGstock。C、 非线性对网络特性的影响分析的最后一步是评估剩余的非线性是否对网络特性有重大影响。如果是这样的话,人们可能会主张使用互信息网络而不是相关网络,因为它包含有意义的附加值。另一方面,如果影响不大,则应首选相关网络,因为相关估计通常更简单、更稳健(经过上述必要的预处理步骤),也更容易解释和传递结果。一般来说,非线性的影响可能取决于图构造方法的类型。

22
可人4 在职认证  发表于 2022-6-10 01:25:16
我们从研究PMFG图开始,重点关注之前定义的关键网络特征:贴近度Cc、平均聚类系数C、偏心率eC、特征最短路径L、分类系数r、特征值中心度CEA以及中心度Cb之间的平均值。由于各种原因,从估计的互信息矩阵生成的PMFG可能与相关矩阵的PMFG不同。其中一个是潜在依赖的真正非线性,另一个是由于有限时间序列的互信息估计不准确而导致的随机变化,另一个原因是相关性和互信息估计器的性质不同,可能存在特定的偏差(例如互信息估计器可能更具噪声,因此提供的网络更类似于随机网络)。我们通过处理线性互信息矩阵而不是直接处理相关矩阵来避免后一个问题,并评估MI PMFG网络的数据是否与其线性代理构建的网络不同。线性替代项保留了原始数据的线性结构(协方差和自方差),但从多元分布中去除了非线性结构。在计算上,线性替代数据可以构造为多元傅立叶变换(FT)替代数据64,65。该程序包括计算级数的傅立叶变换,保持傅立叶系数的大小不变,在相同频率区间内向系数的相位添加随机选择的数字;最后将反向FT应用到时域。使用该过程,我们为由该过程构造的每个NS=999代理数据集构造互信息矩阵和相应的图。

23
nandehutu2022 在职认证  发表于 2022-6-10 01:25:20
然后,可以将数据衍生PMFG的特性与代理衍生PMFG的特性进行比较;任何统计偏差都可以归因于数据与线性的偏差。请注意,这一步骤对于之前量化单个变量对非线性的过程来说并不是多余的,例如,弱耦合(甚至只有细微的双变量非线性)会在网络层面产生子实体效应,反之亦然。该分析的结果如图7所示。对于所有研究的图属性(分类性r的情况除外),MI图属性不偏离从具有相同相关矩阵的线性数据代理中获得的值。实际上,MI图的值与相关图的值不同。然而,除了可归因于MI图估计的随机可变性的分类性之外,所有图属性都存在差异。更严格地说,在具有给定相关结构的多元正态分布的假设下,这种比较可以被框架为统计检验图属性的经验零分布(由线性替代模型实现表示)。与999个代用品进行比较后,我们可以通过观察到的代用品分布中数据点的位置来评估获得的显著性水平;在没有方向性假设的情况下,我们报告了双边检验结果。我们观察到,与线性替代物相比,数据中的分类系数显著增加。为了更详细地理解这个特性,我们更详细地研究了非线性。

24
大多数88 在职认证  发表于 2022-6-10 01:25:23
虽然AIG基于整个矩阵上的异常信息之和被标记为非平稳(见图4),但一旦我们决定使用PMFG图,通过仅对相关PMFG图中的链接求和,可以更相关地量化偏离正态性的偏差。基于此分析,如图8所示,检测到与其他几个股票相关的相对较高的明显非线性,包括股票C和JPM。其余网络与线性代理没有区别,见图9。Cc0.2400.2600.2800.3000.3200.340p=0.648C0.7000.7100.7200.7300.740p=0.502ec5.0005.5006.0006.5007.0007.5008.0008.500p=0.736L3.0003.2003.4003.6003.8004.0004.200p=0.670r-0.180-0.160-0.140-0.120-0.100-0.080-0.060-0.040p=0.034Ce0.0760.0780.0800.0820.0840.086p=0.798图。7: 从去除stockAIG的原始数据(黑线)和相应的线性化代理数据集(histogramin grey)中获得PMFG网络的全局图特征。已通过互信息确定连通性,并考虑了单变量标准化数据。给出的特征是贴近度Cc、平均聚类系数C、偏心率eC、平均最短路径L、分类系数和特征值中心度Ce。给出的p值对应于针对线性代理生成的零分布的双边非参数检验。0.060.040.020.000.020.040.06JPMDDC图。8: 异常信息估计变量对xNi,xnj的Ie(xNi,yNi),其中(i,j)为PMFG的边。

25
何人来此 在职认证  发表于 2022-6-10 01:25:26
条形图显示了代表PMFG中每个股票总体非线性的列的总和。值得注意的是,当在单变量归一化和去除非平稳股票之前对原始数据进行相同的分析时,情况会截然不同,见图10。特别是,MI图的聚类系数明显低于线性替代图的聚类系数(p=0.006)。另一方面,与线性替代物相比,具有更高的偏心率和分类系数。我们可以得出结论,导致线性相关性和互信息图属性之间大部分不匹配的原因在于边缘的非高斯性(而不是依赖性的非高斯性-总体);剩余的一些差异可归因于非平稳性导致的明显非线性。另一种常用的网络构建方法是最小跨度树ECC0.2400.2600.2800.3000.3200.340p=0.800C0.7000.7100.7200.730p=0.732ec5.0006.0007.0008.0009.000p=0.558L3.0003.2003.4003.6003.8004.0004.200p=0.824r-0.180-0.160-0.140-0.120-0.100-0.080-0.060-0.040-0.020p=0.182Ce0 0.0740.0760.0780.0800.0820.0840.0860.088p=0.796图。9: 去除stocksAIG、C和JPM的原始数据和相应线性化代理数据集的PMFG网络的全局图特征。可视化和其他设置如图7所示。Cc0.2400.2600.2800.3000.3200.340p=0.182C0.7150.7200.7250.7300.7350.7400.7450.7500.755p=0.006ec4.5005.0005.5006.0006.5007.0007.500p=0.048L3.0003.2003.4003.6003.8004.0004.200p=0.160r-0.200-0.180-0.160-0.140-0.120-0.100-0.080-0.060p=0.002Ce0.0720.0740.0760.0780.0800.0820.084p=0.338图。10: 原始数据和线性化代理数据集的PMFG网络的全局图特征。可视化和其他设置如图7所示。(MST)。

26
kedemingshi 在职认证  发表于 2022-6-10 01:25:29
重复上述分析,我们没有观察到与多元高斯数据对应的图论结构存在显著偏差,并有偏心率和分类性增加的趋势(见图11)。对于严重偏离平稳性的节点,忽略依赖性估计可能在理论上是正确的,并且对于潜在非线性的逐步定位也是有用的。然而,在实际中,当需要分析整个网络时,只分析较短的数据段更合适,因为在如此短的时间尺度上,非平稳性可能并不突出。对我们数据的检查表明,大多数观察到的非平稳性可能与2008年的全球金融危机有关。这与记录在案的围绕这场危机的网络模式变化是一致的。如果只考虑危机发生前较短时间内的数据,则互信息网络属性与线性替代数据的属性没有实质性差异,见图12和图13。当然,使用PMFG或MST是网络构建的选项,导致网络的表示非常稀疏。主要提供任意网络密度的一种常用网络建设替代方法是使用WTA方法,Cc0.1200.1300.1400.1500.1600.170p=0.170C-0.400-0.2000.0000.2000.400 ec10.00012.00014.00016.00018.000p=0.060L6.0006.5007.5008.0008.5009.000p=0.154r-0.300-0.250-0.200-0.150-0.100-0.0500.000p=0.058Ce0.0450.0500.0500 50.0600.0650.0700.075p=0.626图。

27
nandehutu2022 在职认证  发表于 2022-6-10 01:25:33
11: 删除stocksAIG和BEN的原始数据和相应线性化代理数据集的MST网络的全局图特征。可视化和其他设置如图7所示。Cc0.2600.2800.3000.3200.340p=0.572C0.7000.7100.7200.7300.740p=0.364ec4.5005.0005.5006.0006.5007.0007.5008.0008.500p=0.482L3.0003.2003.4003.6003.8004.000p=0.580r-0.175-0.150-0.125-0.100-0.075-0.050-0.0250.000p=0.264Ce0.0740.0760.0780.0800.0820.084p=0.214图。12: 2003年11月11日至2008年5月11日期间,从原始数据和相应线性化代理数据集获得的PMFG网络的全局图特征。可视化和其他设置如图7所示。i、 e.选择预先定义的阈值,使用仅保留部分最强链接的阈值程序获得未加权图,获得的图的密度是该方法的自由参数。理论上,对于图的某些密度,非线性的影响可能更为重要,因此我们在0到0.99的密度范围内进行分析,步长为0.01。结果如图14、15、16、17、18和19所示。请注意,对于所有图形属性(对分类性有一些豁免),非线性在整个网络阈值范围内对图形属性没有显著影响。与PMFG图的情况类似,边际归一化之前的原始数据并非如此,这表明了此预处理步骤的重要性。Cc0.1200.1300.1400.1500.1600.1700.180p=0.190C-0.400-0.2000.0000.2000.400 ec10.00012.00014.00016.00018.00020.000p=0.124L5.5006.0006.5007.0007.5008.0008.5009.000p=0.148r-0.250-0.200-0.150-0.100-0.0500.0000.0500.100p=0.922Ce0.0450.0500.0650.070p=0.766图。

28
能者818 在职认证  发表于 2022-6-10 01:25:36
13: 2003年11月11日至2008年5月11日期间,从原始数据和相应线性化代理数据集获得的MST网络的全局图特征。可视化和其他设置如图7.0.0 0.2 0.4 0.6 0.8 1.0图形密度0.00.20.40.60.81.0闭合中心度0.0 0.2 0.4 0.6 0.8 1.0图形密度0.00.20.40.60.81.0闭合中心度fig。14: 通过赢家通吃过滤确定的网络密度函数的贴近度中心度。图是数据衍生网络(黑线)和灰色区域,表示线性化代理数据集图的间隔(灰色区域)。该网络是根据真实数据构建的,AIG的股票已被移除。连通性是使用互信息计算的,没有任何标准化(左)和边缘标准化(右)。五、 讨论我们概述了一条管道,在构建相应的复杂网络时,可以消除假定非线性的影响,并可能对多元股票数据中剩余的非线性成分进行本地化。纽约证交所100指数中包含的100只美国股票证明了这一管道。通过将该程序应用于其他两个指数的股票集合,我们获得了类似的结果,这两个指数分别是伦敦证券交易所FTSE100上交易的100只股票和SP500指数中纳斯达克和纳斯达克上交易的500只美国股票;请参阅补充信息。0.0 0.2 0.4 0.6 0.8 1.0石墨密度0.20.40.60.81.0聚类系数0.0 0.2 0.4 0.6 0.8 1.0石墨密度0.20.40.60.81.0聚类系数图。15: 作为WTA过滤密度函数的聚类系数;可视化asin图14.0.0 0.2 0.4 0.6 0.8 1.0图形的密度12345偏心率0.0 0.2 0.4 0.6 0.8 1.0图形的密度123456偏心率fig。

29
可人4 在职认证  发表于 2022-6-10 01:25:39
16: 离心率作为WTA过滤密度的函数;可视化如图14所示。建议的程序从边缘归一化的关键步骤开始。这之前被证明是一个非常有用的预处理步骤,能够去除其他数据集中的大部分非线性36,38,这也被证实适用于股票网络。然而,还有一些剩余贡献可以利用异常信息进行探索。我们提供了一种定位这些组件的方法,并建议移除这些组件,因为它们主要是由非平稳性引起的,如AIG股票的例子所示。经过上述预处理后,随着AIG股票等异常值的去除,PMFG和MST网络的大多数图形特征计算机在系统上与由线性和非线性数据构建的网络相似。类似地,对于使用WTA方法创建的一系列参数化网络,所述预处理消除了根据数据和线性代理创建的WTA网络上计算的特征差异,并针对相同密度范围设置阈值。理论上,存在0.00 0.25 0.50 0.75 1.00 graph0.250.500.751.001.251.501.752.002.25特征路径长度0.00 0.25 0.50 0.75 1.00 graph0.250.500.751.001.251.501.752.002.25特征路径长度图。17: 作为WTA过滤密度函数的特征路径长度;可视化如图14.0.00 0.25 0.50 0.75 1.00图形的密度0.20.00.20.40.60.8分类系数0.00 0.25 0.50 0.75 1.00图形的密度0.20.00.20.40.60.8分类系数图。

30
可人4 在职认证  发表于 2022-6-10 01:25:42
18: 作为WTA过滤密度函数的分类系数;可视化如图14所示。由于链接的存在在WTA方法中是相互独立的(尤其是如果使用固定阈值而不是固定密度),因此具有离群值或非平稳性的变量对WTA网络的影响应小于对MFG或MST网络的影响。因此,WTA网络对于分析中存在的此类变量应更加稳健。除了固定的阈值密度外,还可以在WTA网络中应用预先定义的重要阈值。请注意,对于具有强自相关的时间序列,有一种倾向于更高幅度的相关,最近提出了一种考虑这种影响的替代阈值程序。值得一提的是,在使用描述的管道减少所谓的非线性行为后,仍然存在一些非线性。同时,也可以测试各个连杆的非线性,参见参考文献。36,38,每个单独链接的统计测试通常会导致大量测试(以及多重测试的相关问题),0.00 0.25 0.50 0.75 1.00图的密度0.040.050.060.070.080.090.100.11特征值中心度0.00 0.25 0.50 0.75 1.00图的密度0.040.050.060.070.080.090.100.11特征值中心度fig。19: 特征向量中心度作为WTA过滤密度的函数;可视化如图14所示。然而,个体非线性的统计意义可能无法很好地代表其振幅或网络相关性。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 14:06