楼主: mingdashike22
1452 37

[量化金融] 集群驱动的对数波动率因子模型:源上的深化 [推广有奖]

21
能者818 在职认证  发表于 2022-6-2 17:46:06
正如我们所看到的,我们发现在29个聚类中,有7个对记忆没有显著意义,因此,根据我们的标准,被丢弃。表2的第五、第六、第七和第八列是市场、集群、交互作用和残差对集群中整体记忆的部分贡献。比较表2中的最后四列,我们发现市场和集群对集群整体记忆的贡献量存在显著的异质性,这突出了在我们的因子模型中纳入集群因子的重要性。6集群的经济解释迄今为止,我们一直致力于通过统计工具确定集群。在本节中,我们展示了集群也有一个经济解释。在图8中,我们使用常见行业的行业分类基准(ICB)supersector Classification of common industries,展示了通过DBHT识别的每个集群的集群比较,每种颜色代表不同的supersector。特别是从图8中,我们观察到集群由特定的超级部门主导。例如,我们从图8中可以看出,集群12和22显示了主要的超级部门:集群12的房地产部门f和集群22的技术部门。为了检验这些主导部门的识别是否有意义,我们使用了与[56,40]中相同的假设检验,该检验检验了无效假设,即集群只是随机成为了第二大股票。

22
能者818 在职认证  发表于 2022-6-2 17:46:09
supersector cluster sig market cluster interac Reside1 68 OG(0)T 0.000 0.758 0.055 0.1872 26 OG(0)T 0.000 0.653 0.097 0.2503 12 FS(0)T 0.387 0.463 0.041 0.1104 39 U(0)T 0.855 0.032 0.024 0.0905 13 BR(0)T 0.727 0.199 0.016 0.0586 11 IGS(0.089957)T 0.719 0.073 0.026 0.1827 23 FS(0)T 0.721 0.127 0.053 0.1008 17 FB(0)F 0.818 0.000 0.021 0.1619 HC(0)T 0.923 0.029 0.001 0.04710 24 IGS(0.355912)T 0.471 0.403 0.028 0.09811 11 HC(0)F 0.890 0.000 0.018 0.09312 32 RE(0)T 0.000 0.977 0.005 0.01813 30 FS(0)T 0.662 0.226 0.019 0.09314 144 RE(0)T 0.574 0.272 0.049 0.10515 77 HC(0)T 0.769 0.093 0.012 0.12716 5 TL(0)T 0.968 0.012 0.003 0.01617 66 B(0)T 0.733 0.149 0.040 0.07818 111 B(0)T 0.833 0.088 0.024 0.05519 15 PHG(0)T 0.781 0.134 0.031 0.05420 8 TL(0)F 0.9650.000 0.002 0.03321 172 T(0)T 0.684 0.221 0.013 0.08222 118 T(0)T 0.836 0.071 0.020 0.07323 14 I(0)F 0.951 0.000 0.007 0.04224 12 IGS(0.003514)T 0.911 0.050 0.005 0.03425 17 C(0)T 0.956 0.005 0.003 0.03526 31 R(0)T 0.900 0.036 0.008 0.05727 43 IGS(0 F 0.945 0.000 0.005 0.04928 37 R(0)F 0.940 0.000 0.003 0.05729 15 IGS(0)F 0.954 0.000 0.003 0.044表2:显示第一列为k类,第二列为股票数量。在第三列中,我们有占主导地位的ICB超级部门(缩写为每个超级部门的第一个字母,如图8所示)。在第三列的括号中,我们得到了假设检验的p值,该检验检验是否可以从群中有意义地识别出最主要的超部门【55】,该群给出了6个小数位。第四列详细说明集群模式是否显著减少了该集群的内存。

23
mingdashike22 在职认证  发表于 2022-6-2 17:46:12
第五列、第六列、第七列和第八列分别是市场、集群、交互和残差对总内存的贡献(小数点后3位)。使用超几何分布分配的超部门分类,与超部门确实支配集群的替代假设相比。从5%的显著性水平开始,我们额外使用保守的Bonferroni校正进行0.5nClnicb的多重假设检验[57],以降低显著性水平,其中nCl是通过DBHT识别的集群数量,NICBis是I CB的上层部门数量。这将显著降低至9.0×10-5,将p值报告到小数点后六位。表2详细说明了将这一过程应用于所有集群的结果,第三列中显示了主导超部门。从表2中我们可以看出,在26个集群中,集群确实可以与其支配的超部门相匹配,而在对自身记忆有显著贡献的集群中(见第5.3节),19个对应于其支配的超部门。这打开了选择集群模式的可能性,通过选择集群模式,可以进一步弥补对数波动率之间的因子模型,集群模式在移除市场模式后在统计上显著降低了记忆,但也具有被特定超级部门主导的经济解释。此外,在比较表2中由同一ICB超级部门主导的集群后,我们发现分别由石油天然气和银行超级部门主导的集群k=1、2和k=17、18对市场、集群和相互作用的贡献相似。然而,在某些情况下,由同一个超射体控制的星团没有类似的贡献。

24
何人来此 在职认证  发表于 2022-6-2 17:46:15
例如,k=12、14两个集群均由房地产超级部门主导,但对于k=12,市场在统计上对记忆没有贡献,而fork=14则对记忆有贡献。这可能表明市场正在远离明确定义的工业超级部门,这一点在[55]中也有所提及,并强调了为什么我们使用聚类算法DBHT,而不是直接进行工业分类。7与P-CA和探索性因子分析的比较在本节中,我们将我们的模型与建立良好的PCA启发因子模型[58]和探索性因子分析驱动因子模型的记忆减少性能进行比较。首先,我们阐述了PCA f因子模型的重要性。PCA分析给出了一组正交特征向量,这些正交特征向量定义了相互线性不相关的投资组合,可以通过为每个主成分分配一个单独的因子来帮助定义因子模型。然而,正如我们所指出的,很难决定我们应该保留多少主成分。在我们的分析中,我们在主成分分析因子模型中保留的主成分数量应固定为与因子模型中的因子数量相同,即20。PCA旨在解释相关矩阵E的正交基中的对角线项,即ln | ri(t)|之间的相关矩阵。另一方面,探索性因素分析(FA)更为一般,旨在使用(2)中的一般线性模型解释E的o f f对角线项。同样,在选择应包括多少因子时存在问题[59],但我们将FA模型中因子的数量固定为等于对数波动率因子模型中因子的数量,即20。提取因子后,我们应用因子的varimax旋转[60],这通常用于因子分析以提高可理解性。

25
可人4 在职认证  发表于 2022-6-2 17:46:19
在图9中,我们绘制了去除对数波动率因子模型、FAmodel和PCA因子模型的因子后剩余记忆量的累积分布函数,作为去除前总记忆的百分比。我们从图9中看到,对于对数波动率因子模型,90%的股票只有16.7%的最大剩余记忆量,而90%的股票剩下的最大剩余记忆量为12.7%,这意味着PCA因子模型和对数波动率因子模型对记忆的解释效率相同。对于探索性因子模型,我们发现90%的股票都有21.8%的记忆剩余,这比对数波动性因子模型0.2 0.4 0.6 0.8 1未解释记忆0.10.20.30.40.50.60.70.80.9logvol模型FAPCA图9:蓝线非因子模型未解释剩余记忆的经验累积分布函数,黑色PCA,其中,我们仅采用前23个主成分,并使用23个因子和方差最大旋转进行预测因子分析。与PCA因子模型相比,仍具有可比性。因此,我们可以得出这样的结论:对数波动率因子模型解释的记忆量与其他两个模型相同,即使在主成分分析和探索性因子模型中的因子量相同。8聚类的动态稳定性及其记忆特性迄今为止,给出的结果基于静态相关矩阵,这些矩阵是在我们的数据集中考虑的整个时间段内计算的。接下来自然会出现一个问题,即第5节和第6节中给出的结果是否是动态稳定的。首先,我们将每种股票的时间序列划分为50个长度为1600的滚动窗口,每个窗口的移动时间为56天【55】。

26
大多数88 在职认证  发表于 2022-6-2 17:46:22
对于每个窗口,我们执行与第3节相同的分析。也就是说,对于每个滚动窗口m=1,2。。。,50我们移除在该时间窗口上计算的市场模式,然后使用DBHT算法计算相应的相关矩阵Gm及其聚类Ym。为了解决集群本身是否是动态稳定的问题,我们使用了与第6节中介绍的程序类似的程序,也在[55]中进行了介绍。具体而言,对于每个时间窗口m,我们使用超几何测试来查看s统计聚类X中的每个聚类是否在统计上与Ym中的聚类相似,并记录可能匹配的时间窗口数。这记录在图10的蓝色条中。我们还计算了ym中的每个集群是否仍能在统计上减少每个时间窗口m中的内存,并测量发生这种情况的时间窗口总数,如图10中的红色条所示。这两个数字给出了每个集群的外观和统计内存减少属性的持久性度量。如图10所示,大多数集群非常稳定,出现在大多数时间窗口中。除此之外,还有集群6、10、24,有趣的是,它们都可以与工业产品和服务超级部门(见表2)相区分,以及集群16,这是一个非常小的集群,只有5只股票,因此由于其规模较小,更可能在时间上不稳定。从图10中,我们还可以得出结论,第5.3节中确定的集群的记忆过滤特性在时间上是稳定的。这是因为图10表明表2中静态集群在记忆意义上的高持久性(红色条),这些静态集群在统计上有助于其记忆(例如集群2和集群12)。

27
大多数88 在职认证  发表于 2022-6-2 17:46:25
另一方面,对于静态情况下不贡献自己内存的集群(例如集群27、28、29),我们发现其内存持久性较低。9结论我们提出了一个新的对数波动率因子模型,讨论了模型中的每一项如何影响波动率聚类的程式化事实。这减少了对数波动率与全球因素(即所谓的市场模式)以及第二和第三局部因素(即集群模式和相互作用)之间的线性相关关系中存在的信息。使用一种新的非参数、集成的波动率聚类代理,我们发现波动率和波动率聚类之间确实存在联系。首先,对数据集进行了全球检查,这使得市场能够解释数据集中存在的大部分波动性集群效应。然而,通过聚类分析得出的局部聚类反而显示出显著的可变性:在某些聚类中,聚类模式本身可能有助于波动性聚类。这使我们能够仅选择统计相关的聚类因子,进一步减少了对数波动性和因子数量之间的相关性b中的信息。从这些减少的因素集中,我们可以通过确定其主要的ICB超部门来选择具有经济解释的因素,从而进一步减少相关因素的数量。这是非常重要的5 10 15 20 25否。外观无。活动图10:蓝色条是聚类k(其标识在2中详细说明)可以与Ym中的聚类进行统计识别的时间窗口数,Ym是在长度为1600的50个滚动窗口上计算的聚类。

28
nandehutu2022 在职认证  发表于 2022-6-2 17:46:28
红色条是时间窗口的数量,其中X中的聚类可以在统计上减少其在滚动时间窗口m上的内存。由于我们没有主观选择因素的数量,因此相对于其他可能用于对数波动性的潜在因素模型(如PCA和探索性因素分析)而言,该模型具有优势,此外,还因为这些因素通过确定其主导的ICB超级部门,具有更清晰的经济解释。对数波动率因子模型与PCA和探索性因子模型的比较表明,它们解释了数据集中相同的内存量。集群和他们报告的记忆过滤也被发现是动态稳定的。这项工作与波动率建模领域尤其相关,因为大多数多变量模型,如GARCH的多变量扩展、随机协方差和已实现协方差模型,都会受到维数灾难的影响,并增加参数数量。本文提出的对数波动率因子模型可以通过识别本文中给出的一组简化因子来帮助减少这些模型所需的参数量。附录A。1数据清理过程我们的数据集无法按原样使用,因为价格时间序列没有对齐,这是因为事实上某些股票在某些日期没有交易。为了克服这个问题,我们应用了一个数据清理过程,它允许我们保存尽可能多的库存。例如,我们不想仅仅因为某只股票在给定的时间跨度内几天内没有交易就删除它。主要想法是通过拖拽最后一个可用价格来填补缺口,并假设价格时间序列中的缺口对应于零对数回报。同时,我们不想拖累太多的价格,因为用零填充的时间序列在统计上并不显著。

29
可人4 在职认证  发表于 2022-6-2 17:46:32
有鉴于此,我们从数据集中删除了在某种意义上太短的时间序列。具体步骤如下:1。从数据集中删除长度小于p乘以最长价格时间序列的价格时间序列;2、在剩余时间序列中找出共同的最早日期;3、创建一个参考时间序列,其中至少有一只股票从上一步中发现的最早公共日期开始交易;4、将参考日期时间序列与每只股票的日期时间序列进行比较,并通过拖拽最后可用价格来填补缺口。在本文中,我们选择p=0.90,从而尽可能多地保留未修改的时间序列。然而,如果我们选择p.a.2加权方案的更高值,结果不会改变。在此,我们将确定本文中分别用于ξi和ξikde finedin(6)和(9)的两种类型的加权方案。第一种加权方案基于E和G的特征谱。现在有必要解释特征向量v的财务解释,其中E的输入项为Andeigenvalueλ。vican可以被视为v定义的投资组合的权重。通过方差测量投资组合波动性的风险,我们可以看到:TXtXiviln | ri(t)|=XijvivjEij=λ(19),因此λ代表v给出的投资组合波动性的风险。我们设置ξi=vi,其中vii是与经验相关矩阵E的最大特征值相对应的特征向量的第i个条目。这被称为市场特征值,因为它代表所有股票一起移动【13】,也是股票组合,通过其相应的特征值给出市场波动模式的风险。我们还可以使用真实指数来确定权重,例如:。

30
能者818 在职认证  发表于 2022-6-2 17:46:35
theDow Jones,但[45]表明,与伪指数相比,这并不能有效地消除模式对回报的影响。权重ξi以类似于市场模式的方式确定,我们将只考虑G中与集群成员相对应的部分。定义GG(k)={G}(i,j)的子矩阵∈clusterk(20)其中{…}(i,j)∈聚类k指的是只保留元素,其中i和j是聚类k中的股票矩阵。因此,G(k)是对应于聚类k的G的方子矩阵。该子矩阵是仅由属于聚类k的股票组成的市场的相关矩阵。因此,以与市场特征值完全相同的方式,G(k)的最大特征值表示集群的股票一起移动,特征值的值表示集群市场投资组合的风险,相关特征向量表示此类投资组合的权重。因此,通过设置ωik=v(k)i来确定簇k的权重ξik的定义,ωik=v(k)i是与G(k)的最大特征值相对应的第i项。这是使用的加权方案,并与等权方案进行比较,其中ξi=Nandξik=mkin图5a、5b和6,然后使用等权方案。A、 3弹性净回归弹性净回归用于使用公式(7)确定βik和βik′的值。本附录提供了使用该方法的更多详细信息。弹性网回归[47]是里奇正则化和套索回归的混合版本,因此提供了一种处理相关解释变量(在我们的例子中为Ik(t)和Ik′(t))的方法,并执行特征选择,其中考虑了岭正则化将忽略的非交互簇Ik′(t)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 17:40