楼主: 能者818
1504 48

[量化金融] 金融市场结构与实体经济的关系: [推广有奖]

21
mingdashike22 在职认证  发表于 2022-5-6 06:59:27
总的来说,减去市场模式会使集群更加同质,这表明在非去趋势情况下SL和AL中出现的最大集群与市场模式动力学有关。SL和AL的算法确实预计会对市场模式更加敏感。例如,在生成SL树状图的操作过程中,两个新集群之间的相关性被定义为第一个集群的元素与第二个集群的元素之间的最大相关性:由于市场中的大部分相关性是由于市场模式[27]这种分析算法可能会迫使许多集群加入由市场中最具影响力的股票组成的集群,导致巨大的集群和巨大的差异。AL对这种影响不太敏感,因为簇间相关性被定义为相关性的平均值;对于CL,选择了最小相关度,结果——毫不奇怪——是差异的最小值。对于DBHT而言,PMFG的拓扑结构可能比MST更加结构化和集群化,从而降低了对市场模式动态的敏感性。我们可以得出结论,从差异度量的角度来看,所分析的聚类方法在树状图的任何层次上提供了相当不同的结构。DBHT产生的聚类结果最为一致,而SL显示的差异水平最高。检索工业部门在本节中,我们通过改变集群SNCL的数量来量化集群和ICB之间的相似性。我们使用了方法(等式9)中引入的调整后兰德指数。图6显示了第一组分析的结果。我们将五种聚类方法应用于1997-2012年的整个时间段,然后我们改变了Ncl的聚类数量。

22
mingdashike22 在职认证  发表于 2022-5-6 06:59:30
对于以这种方式获得的每个聚类,我们计算了该聚类和ICB Supersector分区之间的调整后兰德指数radjb。通过这种方式,我们探索了整个层级结构。0 100 200 30000.20.4nclardj a)k-Medoids完整链接单链接平均链接bHT0 100 200 30000.20.4nclardj b)k-Medoids完整链接单链接平均链接bHT图6。证明不同的聚类方法检索不同数量的工业部门信息。对于不同数量的集群Ncl,显示了集群和ICB超级部门之间的调整后兰德指数Radjb。在a)中,相关性是根据非去趋势的日志返回计算的;在b)中,相关性是根据去趋势的日志返回计算的。垂直虚线显示了与ICB超射体实际数量相对应的值(Ncl=19)。图6 a)指非去趋势情况,图6 b)指去趋势情况。图中的垂直虚线表示数值Ncl=19,即ICB超射体的数量。对于所有方法,我们观察到Ncl的低值呈上升趋势,当Ncl达到342时,出现最大值,然后朝零下降趋势。然而,五种方法在最大化的价值及其地位方面存在差异。在非去趋势情况下,我们发现调整后的兰德指数的最高值R*adj,由DBHT(0.419)、k-MEDOID(0.387)和完整连杆(0.387)实现。有趣的是,这三个值彼此非常接近,可能表明这一水平是相关聚类和ICB超射体之间的实际最大相似性。然而,与每个最大值对应的簇数(N*cl)取决于方法,分别为13、17和39。值得注意的是,DBHT和k-medoids的最大值非常接近图6中虚线所示的“真实”ICB超反射体Ncl=19。

23
能者818 在职认证  发表于 2022-5-6 06:59:33
然而,与两种分层方法相比,k-medoids值更具敏感性。平均连杆数和单连杆数反而要低得多*adj(分别为0.352和0.184)和更高的N*cl(分别为111和229)。对于去趋势情况,我们首先注意到,所有方法的Radjin最大值都增加了。对此的自然解释是,市场模式在某种程度上隐藏了ICB结构,它驱动着其工业超级部门的所有股票。CL显示出最高的相似度(0.510),其次是AL(0.48,与非去趋势病例相比表现出最显著的增加),k-medoids(0.467)和DBHT(0.444)。SL再次成为排名的最后一位(0.315)。排名在N*CLI与市场模式的情况相同:最低N*对于DBHT(20),其次是k-medoids(25),完全连锁(50),平均连锁(60)和单连锁(101)。我们要强调的是,尽管DBHT在这种情况下没有最高的拉德金,但它的最大值最接近真实的Nclof 19。一般来说,市场模式对N的影响*CLH根据聚类方法发生变化:对于DBHT、CL和k-medoids,减法增加N*cl,而AL和SL的相同数量显著减少。连锁方法的影响更大,而DBHT和k-medoids的影响较小。总的来说,我们可以得出结论,在检索ICB信息时,通过改变DBHT、k-medoids和Clout的聚类数(Ncl)可以执行其他两种聚类方法。然而,DBHT、k-medoids和CL具有R的峰值*不同的;不同的*clvalues。特别是,DBHT和k-MEDOID能够在N处检索ICB信息*这是最低的,并且最接近CB超射体的实际数量(19)。

24
大多数88 在职认证  发表于 2022-5-6 06:59:36
减去市场模式后,AL也达到了DBHT、k-medoids和CL的相同水平,但N过高*cl.有趣的是,平均法和单链法的聚类既有最低的Radjan值,也有最高的差异值y:也就是说,差异y越大,聚类法检索行业分类的能力越弱。这一定是因为y非常高时存在一个大的集群:这再次表明对市场模式的强烈敏感性(见上一节),这隐藏了将许多股票合并到一个集群中的部门内相关性。我们在上文中已经提到,调整后的兰德指数提供了集群和ICB分区之间相似性的总体衡量标准。现在,让我们关注一个更明确的分析层次,通过该层次,我们可以量化集群对每个工业部门的检索程度。为此,我们改变了聚类的数量,对于每个聚类,我们对每对聚类/ICB超射体进行了单尾假设检验(见方法,等式11)。在图7中,我们用条形图展示了五种聚类方法中每一种的分析结果,方法是使用去趋势日志返回。x轴显示Ncl,而y轴上的N代表因Ncl值而被拒绝的超几何测试总数(即ICB超级扇区被集群过度表达的次数)。每个条上的颜色显示了每个不同超反射层的过度表达数量。我们为测试等式选择了一个显著性水平为0.01,以及保守的Bonferroni校正[36],该校正将显著性水平降低至0。01/(0.5)* Ncl* NICB),并减少了ICB超导体的数量(19)。

25
何人来此 在职认证  发表于 2022-5-6 06:59:40
(在S1文件的图S6中,我们还报告了相对数字N/(0.5)* Ncl* (NICB)正如我们所见,不同的方法中NCL的成分和趋势是相当不同的。BHT显示过度表达ICB产业的集群数量最多,其次是k-medoids、CL、ALAN和SL。让我们注意到,在调整后的兰德指数分析中,AL和SL的表现也最差(见图6 a)。然而,在该分析中,DBHT、k-medoids和CL显示出非常接近的调整后的指数值;因此,假设检验能够更好地突出这些方法之间的差异。关于行业组成,我们可以看到DBHT、k-甲酰胺、CL和ALshow是一个相当均匀的组成,几乎每个ICB超切分体都过度表达。SL INSTEADE显示的成分要少得多,即使在总过度表达的最高水平上,也不超过6个同时过度表达的超反射体。0 100 200 300 4000102030NclNDBHTa)0 100 200 300 4000102030NclNAverage Linkage b)0 100 200 300 4000102030NclNComplete Linkage c)0 100 200 300 4000102030NCLsingle Linkage)1234567891011213050100150200250350Cluster label库存数量Single Linkage汽车和零件银行基本资源方案建筑和材料金融服务食品和斜面健康护理工业品服务保险中介油和天然气个人和家居用品Real EstatereTailtechnology系统通信水平和休闲设施0 100 200 300 4000102030 NCLK Medoidise)图7。聚类方法检索到的ICB信息量,以每个聚类过度表达的ICB超射体为单位。每个条形图显示,根据超几何假设检验(即,被拒绝的零假设检验的数量),一个ICB超切分体被一个簇过度表达的次数(N)随着簇Ncl数量的变化而变化。

26
mingdashike22 在职认证  发表于 2022-5-6 06:59:43
每种颜色显示每个ICB超切面的过度表达数量。在图a)-e)中,分别显示了DBHT、AL、CL、SL和k-中值聚类的结果。相关性是根据DetrendLog返回值计算的。非去趋势情况见S1文件中的图S5。就N形而言,DBHT达到峰值,很快就降到了高值的低值。相反,这三种连接方法更灵活,沿着NCL轴分布更广,这一特征在拉德金图6的趋势中也很明显。k-medoids似乎是这两种形状的混合体,但当NCL发生变化时,ICB成分中的噪声和不稳定性水平要高得多。最后,值得注意的是,在不同的Ncl值下,成分发生了变化,并且在四种分层聚类方法中可以找到类似的模式(对于k-Medoids,由于该方法的不稳定性更高,因此无法找到清晰的模式)。有一些超级行业往往在低价值的NCL中过度表达,然后在中等价值中消失:汽车和零部件、电信、保险和金融服务就是这样。另一些则更加持久,出现在所有x轴上:公用事业、技术、石油和天然气。最持久的是后者,当其他所有的超分子都不表达时,后者仍然过度表达。然后,我们可以得出结论,根据聚类方法,不仅ICB分区隐藏在程序的不同级别(参见“检索工业部门”一节),而且不同的ICB超部门也在不同级别检索。

27
nandehutu2022 在职认证  发表于 2022-5-6 06:59:46
这可能是由于不同的ICB超部门之间存在不同程度的相关性。通过使用非去趋势对数回归,我们得到了非常相似的结果,除了所有方法的总体下降,与“检索工业部门”中的结果一致。细节如S1文件中的图S5所示。动态分析本文对1997年1月1日至2012年12月31日这15年间的DBHT聚类进行了动态分析。我们选择了“数据集和初步分析”中描述的一组重叠时间窗口(n=100个时间窗口,长度L=1000个交易日),并使用了Pearson估值器的加权版本(等式13),以减轻远程观测中对异常值的过度敏感性。在图8中,a)显示了每个时间窗口获得的DBHT簇的数量,包括非扭曲日志返回(红色圆圈)和去渲染日志返回(蓝色方块)。对于第一种情况,聚类数在6到19之间,对于第二种情况,聚类数在14到26之间。让我们强调一下,这是DBHT方法自动提供的“自然”簇数,而不是任何阈值处理的结果。虚线是与使用整个时间段1997-2012作为时间窗口获得的聚类相对应的值。通过自举方法对这些聚类的统计稳健性进行了研究:结果表明,图8 A)中显示的聚类数对日志返回时间序列的重采样具有稳健性,如下一节“DBHT的稳健性:自举分析”中所述。如前所述,非去趋势情况下的团簇数量在系统上低于去趋势情况下的团簇数量。

28
可人4 在职认证  发表于 2022-5-6 06:59:50
此外,非去趋势值呈现整体下降趋势,并使其低于相应的虚线;这种下降模式在弯曲的情况下不存在,但在大多数情况下也保持在相应的虚线以下。对于非去渲染和去渲染的情况,等式4中引入的视差y的演化如图8 b)所示。同样,虚线是所有时段的值。在非去趋势的情况下,我们看到了总体的增长趋势,尤其是在2006年之后;对大小分布的分析表明,最大的集群包含多达240只股票(占股票总数的70%);此外,从2006年起,我们还观察到了更高的数值波动。这种行为令人感兴趣,因为它涉及市场模式对相关结构的整体影响,y越高,表明市场模式的影响越大,倾向于将所有股票集中在一个集群中。事实上,在去趋势的情况下,我们发现减去市场模式会使增加的趋势消失,而减少的不平衡值会更接近虚线,除了一些波动之外,没有显著的模式。为了更好地理解通过去趋势和非去趋势对数收益获得的DBHT聚类之间的关系,我们还进行了动态调整的兰德指数分析。Now2000 2002 2004 2006 2008 2010 2012 2014051015202530NCL a)非去趋势趋势2000 2002 2004 2006 2008 2010 2012 201400.511.52ty b)非去趋势趋势2000 2002 2006 2008 2010 201400.10.20.30.40.50.60.70.8tRadj(Tk)c)图8。DBHT团簇的动力学演化。每块地块指100个移动时间窗口,长度为1000个交易日。

29
可人4 在职认证  发表于 2022-5-6 06:59:54
具体而言,在图a)中,我们绘制了未去趋势的对数收益(红色圆圈)和市场模式去趋势的对数收益(蓝色方块)的DBHT聚类数Ncl,而两条水平虚线是通过采用4026个交易日的最大时间窗获得的Ncl值。总体而言,未去趋势的情况显示出下降趋势。在图b)中,显示了两组DBHT聚类(未去渲染的红点、未去渲染的蓝点)的视差度量y,水平虚线是4026长度时间窗口的y值。在非去趋势的情况下,2007年标志着y值向更高和更易波动的过渡。最后在图中,显示了在去趋势和非去趋势聚类之间的每个时间窗口测量的调整后的兰德指数Radj。一个稳定的下降趋势是明显的。我们不再比较集群和ICB分区,而是在每个时间窗口比较两个集群(非去渲染和去渲染)。在图8 c)中,显示了两组DBHT簇之间调整后的兰德指数。有趣的是,它显示了一个稳定的下降趋势,使得相似性从相对较高的值(约0.7)到接近于零的值,这表明两个聚类之间完全不相关。因此,我们可以得出结论,在过去15年中,市场模式的影响显著增加,使得去趋势集群结构与非去趋势集群结构越来越不同。让我们注意到,如果没有聚类分析,这一观察是不可能的,因为从初步的数据集度量(详见S1文件中的图1和图S2)来看,无论是在平均回报率还是在平均相关性中,都不明显存在任何恒定模式。动态检索产业部门让我们从动态视角研究产业分类和集群之间的关系。

30
kedemingshi 在职认证  发表于 2022-5-6 06:59:57
为此,我们在这里通过考虑100个重叠时间窗口的集合来执行之前的动力学分析,并计算聚类和ICB超射体分类之间的调整后兰德指数Radj(Tk)。由于Radj(Tk)随选择的阈值和Ncl而变化,我们每次都选择使Radj(Tk)最大化的Ncl;我们报告的数字是这些最大值,因此说明了聚类方法检索ICB的最大能力。无花果。9 a)-e)我们使用marketmode的收益率展示了五种聚类方法的结果。有趣的是,随着时间的推移,它们都呈下降趋势。平均而言,DBHT和CLHT与工业类别的相似性最高,而单一联系的相似性最低。这与静态分析结果一致。我们还在图表中强调了过去15年中影响股市的主要事件。可以观察到,不同的聚类方法受到这些事件的不同影响。例如,如果我们在2001年至2007年期间观察到的所有事件都与2001年至2007年期间的股市下跌有明显的相似性,那么我们只能在2001年至2007年期间观察到的所有事件。特别是2002年的经济低迷导致SL和AL的相似性急剧下降,直到2005年底都保持在较低的水平。相反,DBHT、完全连锁和k-medoids似乎不受这些事件的显著影响。这一观察结果指出,DBHT、CL和KMEDOID比SL和AL在检索经济信息(如工业分类)的能力方面更能抵御外生事件。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-1 20:13