楼主: mingdashike22
1451 37

[量化金融] 集群驱动的对数波动率因子模型:源上的深化 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-2 17:45:26
现在,我们需要找出聚类结构是什么,我们首先计算G,即ci(t)之间的互相关矩阵,定义为gij=TTXt=1ci(t)cj(t)。(8) 然后,我们将聚类算法应用于G。我们在去掉市场模式后使用聚类算法,因为这会提供更稳定的聚类[45]。我们将使用有向BubbleHierarchy树DBHT【39、40、46】来确定股票的集群成员。使用DBHT是因为与其他层次聚类算法相比,它提供了信息检索的最佳性能方面【40】。使用DBHT算法还意味着,我们不必预先假定应该包含多少个集群因子,而是直接从数据中提取它们。从表2可以看出,DBHT算法共识别出K=29个聚类,最大的聚类由172只股票组成,最小的聚类由5只股票组成。平均簇大小为41.4.3.3簇模式和相互作用一旦确定了每个簇的数量和组成,我们可以将一个因子与每个簇k相关联。然后通过响应性βik′来表征相互作用,其中k 6=k′,即ci(t)如何将w.r.t变为ik′(t)。我们将k类的聚类模式Ik(t)再次定义为kIk(t)=Xi中资产的加权平均波动率∈簇kξikci(t)。(9) ξik是k组中股票i的权重。从公式(7)中,我们可以看到,与市场模式的情况类似,我们可以通过将ci(t)与ik(t)和ik′(t)线性回归来确定βik,βik′和αik,αik′。我们使用弹性净回归[47]来确定βik和βik′,以考虑ik(t)和ik′(t)相关的可能性,同时也允许一些βik′为0,因为我可能不会与簇k′相互作用。

12
kedemingshi 在职认证  发表于 2022-6-2 17:45:30
关于弹性净回归的更多详情,请参见附录A.3.4波动率聚类和波动率互相关之间的经验联系。在导言中,我们选择了与inEq分解相关的因素。(7) ,通过衡量每个集群对波动性集群的影响。在开始关注此分析之前,让我们先介绍一下本文其余部分中使用的波动率聚类代理。4.1波动率聚类波动率聚类是所谓的金融数据类型化事实之一,表示由于波动率是自相关的,因此收益率不是独立的。自相关函数(ACF)κ(L)定义为κ(L)=corr(ln | r(t+L)|,ln | r(t)|)(10)=h[ln | r(t+L)| ln | r(t)|]iσ,(11),其中h。。。i表示预期。L是滞后,σ是ln | r(t)|过程的方差,请注意,我们使用对数绝对值回报作为波动率的代理。对这一结果的解释是,收益率的大幅度变化通常伴随着其他收益率的大幅度变化,或者收益率保留了以前值的记忆【50】。因此,波动性聚类也可以称为记忆效应。κ(L)也被假定遵循幂律衰减:κ(L)~ L-βvol,(12)其中βvol描述记忆效应的强度。较低的βvol值表示保留了对过去值的更多记忆。为了计算β,我们将等式(12)转换为对数标度,并计算0 1 2 3 4 5 6log(L)-4-3.5-3-2.5-2-1.5-1-0.5empiricalfit(a)可口可乐企业股份有限公司βvol=0.45440 0.5 1 1.5 2 2 2.5 3.5 4 4.5 5log(L)-4-3.5-3-2.5-2-1.5-1-0.5empiricalfitted(b)越洋βvol=0.3975图1:对数绝对值回报的经验ACF图1a和Transocean中可口可乐公司(KO)的蓝色实线)(钻机)如图1b中的对数-对数比例。

13
能者818 在职认证  发表于 2022-6-2 17:45:33
线性最佳拟合也显示在红色虚线中。线性b检验的斜率,它给出了指数βvol。我们应该使用theil-Sen程序计算βvol,而不是使用标准最小二乘法,因为它对异常值更为稳健【51】。我们在图1中报告了可口可乐企业(股份有限公司)在图1a和跨海生物素(Transoceanicin)图1b中的函数κ(L),这两个函数均以对数标度表示,并绘制了线性最佳t。我们定义了经验波动率互相关项E asEij=TXt=1ln | ri(t)| ln | rj(t)|。(13) 波动率互相关的代理是Stock i的平均互相关,ρvoli,定义为ρvoli=N- 1NXi6=jEij(14)使用波动率聚类和波动率互相关的代理,[52]发现ρvoli和βvoli之间存在负相关,我们在日常数据集上使用ln | r(t)|,而不是原始高频数据和[52]中使用的| r(t)|,如图2所示。这一结果的主要结果是,它意味着一只股票i的波动性与其他股票的关联越大,记忆效应越强,因此它保留了更多关于先前波动性值的信息,将波动性聚类的强度与波动性之间的互相关矩阵联系起来。4.2非参数记忆代理如前所述,符合绝对收益自相关函数的β幂律指数是记忆效应强度的代理:β越低,记忆效应越强。使用幂律量化记忆效应是参数化的,因为尾部通过指数β呈幂律衰减。自相关函数本身可能因其收敛速度慢而有噪声[48],如图1所示。

14
可人4 在职认证  发表于 2022-6-2 17:45:38
鉴于此,0 0.05 0.1 0.15 0.2 0.25 0.3 0.35ivol0.10.20.30.40.50.60.7图2:ρvoli和βvoli之间的负相关性。使用单侧Spearman秩相关在5%水平上检验了负相关,并拒绝了无相关性的无效假设,这证实了我们数据的结果。相反,我们引入了一种新的无模型代理η,通过整合自相关函数超时滞后L直到Lcut,我们将其定义为5%水平的标准Bartlett切割[53]。η=zlcutel=1κ(L)dL,(15),其中κ(L)是对数绝对收益的经验自相关矩阵,作为标签L的函数。使用此代理,η的值越大,记忆影响的程度越大(在β代理中,这对应于指数的值越大)。所有股票报告的中值为20.7318±8.6901,其中,使用η定义的绝对偏差(MAD)的中值计算所有股票的误差,asMAD=中值(|ηi- 中值(ηi)|)。(16) 我们还在图3a中绘制了β作为记忆效应替代物与η的对比图,正如预期的那样,它显示了η与β记忆替代物之间的增加关系,这是文献中使用的,因为较大的记忆效应意味着较高的η,但较低的β。这为我们使用η提供了依据。这证明η与βvol一致,因此可以作为记忆效应强度的代表。图3b是ρvolivsη的曲线图,它证实了[52]使用η代替βvol的主要结果,并使用Spearman的秩相关在5%水平上对无效假设进行了检验,该假设被拒绝,即ρvoliandη与存在显著正相关关系的替代假设之间没有相关性。

15
nandehutu2022 在职认证  发表于 2022-6-2 17:45:42
因此,我们的代理人也可以确认[52]的结果。在图4a中绘制LCUTVη,表明具有强短内存的进程将具有较低的裁剪,从而具有较低的η,虽然具有长内存组件的进程将具有更高的LCUTAD0 0.1 0.2 0.3 0.4 0.5 0.6 0.7vol(a)βvolvsη0 0.05 0.1 0.15 0.2 0.25 0.3 0.35ivol(b)ρvolivsη图3:在图3a中,我们绘制了记忆效应强度与集成代理的βvolpower定律表达式。在图3b中,我们绘制了文本中定义的ρvolian和η之间的关系。图3a中的递减关系和图3b中的递增关系在5%的水平上使用斯皮尔曼等级相关性进行了分类,但在这两种情况下均被拒绝。Lcut0 100 200 300 400 500 600 700 800 900(a)LCUTVηLcut0 100 200 300 400 500 600 700 800 9000.10.20.30.40.50.60.7(b)LCUTVβ体积图4:左侧的图是所有库存的LCUTVη图。右边的图表是所有股票的LCUTVβVol。图4a中所示的递增关系和图4b中所示的递减关系使用Spearman秩相关进行测试,分别为0.7871和-0.4271,在5%的水平上具有统计学意义。η. 这一点很重要,因为波动率聚类是时间序列中存在长记忆的结果。图4b中的LcutvsβVol的类似图显示,βvolas Lcutincreases的预期减少,但其关系不如Lcutvsη的关系强(在5%水平下测试的绝对Spearman相关值为0.4271 vs 0.7871)。其结果是,通过等式中引入的因子模型,与本节中的βvol.5记忆过滤相比,η可以更好地区分短记忆过程和长记忆过程。

16
何人来此 在职认证  发表于 2022-6-2 17:45:45
(5) (7)同时,通过前面小节中介绍的η代理,我们希望了解记忆强度和波动率互相关之间经验联系的起源。这一分析反过来也将是我们模型中集群模式选择的基础。主要的直觉是,市场模式、集群模式和交互模式都会带来关于某个股票时间序列记忆的相关信息。5.1评估记忆贡献让我们在这里描述我们使用的方法,以了解方程式中f因子模型中每个项对记忆的贡献。(5)(7). 对于每个时间序列,比如股票i,我们遵循astep分步程序,通过测量以下四次的代理ηIf值:1。关于平面时间序列ηi,pl;2、市场模式移除后的剩余时间序列ηi,M M;3、在剩余时间序列上,一旦市场模式和集群模式(股票所属的集群)被移除ηi,CM;4、在剩余时间序列上,一旦市场、集群和交互模式都被移除。为了进行定量比较ηi,IM。下一步是评估每次删除后的内存减少情况。我们通过计算两个随后计算的ηi值的比率来实现这一点。对于股票i,我们得到1。ηi,MMηi,P定义了市场模式导致的内存减少;2、ηi,CMηi,mm定义了一旦市场模式被取消,集群模式导致的内存减少;3、ηi、IMηi、CMde定义了一旦市场模式和集群模式被移除,交互模式导致的内存减少。根据定义,如果比率低于1,则意味着在相应的删除过程中发生了内存减少。为了了解这些比率的平均表现,我们取所有股票的中位数。

17
可人4 在职认证  发表于 2022-6-2 17:45:48
因此,例如,市场模式对给定股票s的平均记忆减少是指数i上计算的中位数(ηi,MMηi,P L)。至于与此测量相关的误差,我们使用中位数平均偏差[54],定义为ηi,MMηi,P LMADηi,M Mηi,P L(17) =中值ηi,M Mηi,P L- 中值的ηi,M Mηi,P L, (18) 对于ηi,CMηi,mm和ηi,IMηi,CM,s相似。选择中值和MAD都是因为它们与异常值的误差。我们认为,在给定的一组股票上,如果中位数加上比率的mad低于1,则会显著减少记忆。5.2整体市场分析:寻找记忆的主要来源我们在这里应用前一节中所述的程序,以获得第2节中所述的数据集。为了完整性,在图5中,我们报告了未加权方案和加权方案的分析结果。图5a报告了比率值以及误差(黑色垂直条)。我们观察到,在所有情况下,平均值加上误差都保持在1以下,这意味着每个词对整体记忆都有意义。然而,我们也注意到,特别是对于来自集群模式的减少,股票之间存在很大的差异。图5b报告了相同的结果,但显示了每次删除对总体内存的贡献。根据我们的分析,大多数贡献来自市场模式,而市场模式是波动性的主要记忆来源。我们还在图6中列出了在删除所有贡献后,x轴上报告的最多剩余内存百分比的股票份额的累积值。例如,从图6中,我们发现90%的股票只有16.7%的记忆是无法解释的。

18
大多数88 在职认证  发表于 2022-6-2 17:45:56
我们还注意到,图6中的加权版本和未加权版本之间几乎没有差异,因此我们将在这里使用未加权方案进行大多数分析。该分析确定了对数波动率和波动率聚类之间确实存在联系。5.3逐群分析:因子的选择标准在本小节中,我们不是汇总整个市场内存减少的结果,而是在逐群的基础上专门检查内存发生了什么。为简洁起见,我们仅详细讨论第3.2节中讨论的DBHT算法所定义的集群12和集群22的情况,因为它们提供了大量关于集群级别上可以发现的不同行为的信息。然后,我们重复前面小节中执行的相同分析,但报告这两个特定集群的行为。在图7中,我们报告了我们对未加权方案的分析结果。图7a报告了比率值以及误差(黑色竖线)。不同的是,对于整个数据集,我们从图7a中可以看出,集群模式移动了集群12的绝大多数内存,而没有任何来自市场模式或交互的贡献。相反,对于集群22,我们从图7a中看到,市场是记忆的主要贡献者,而集群m模式在一定程度上减少了一些剩余的记忆,并且交互作用也没有提供太多的贡献。图7b报告了相同类型的结果,但与总体内存相对。这些结果表明,局部分析揭示了对数波动率因子模型中的术语如何影响记忆效应的更丰富行为,表明对数波动率的相关结构与记忆效应之间也存在联系。

19
能者818 在职认证  发表于 2022-6-2 17:45:59
鉴于这些结果,我们认为,在所有集群模式中,选择统计上有意义的因素的良好标准应包括在我们的MM CM IM0.20.40.60.8等权重定义中(a)等权重0.20.40.60.8MMIMM残差(b)图5:第5.1节中描述的所有市场股票的程序结果。图5a是从左侧开始计算的整个市场的存储代理比率的中位数,ηi,MMηi,P L,ηi,CMηi,MM和ηi,IMηi,CM。蓝色条表示等权重方案,黄色条表示加权方案。黑色竖线表示应用于整个市场的股票记忆还原之间的误差,该误差使用公式(18)及其其他比率的等价物计算。在图5b中,我们将市场(MM)、集群(CM)和互动(IM)对记忆效果的贡献绘制为相对于整体记忆的百分比。剩余的是贡献者无法解释的内存的剩余百分比。这些价值是在整个市场上计算出来的。左栏用于等权方案,右栏用于加权方案。0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1未解释内存0.10.20.30.40.50.60.70.80.9等权重图6:删除模型所有贡献者(市场模式、集群模式和相互作用)后剩余内存为分数的股票分数的累积分布。红线表示加权模式,蓝色表示等权模式mm CM IM0.51.5cluster 12 cluster 22(a)cluster 12 cluster 220.20.40.60.8mmim残差(b)图7:与图5相同的一组图,但使用等权方案并仅取属于cluster 12和22的堆栈。

20
何人来此 在职认证  发表于 2022-6-2 17:46:03
在图7a中,我们绘制了从左侧开始的ηi、MMηi、P L、ηi、CMηi、MM和ηi、IMηi、CM的中位数比率,这些中位数比率是根据第12组中蓝色条的库存和黄色条的库存(包括22)计算的。使用等权重模式。黑色竖线表示应用于集群12和22中股票的股票内存缩减中的错误,这是通过使用公式(18)及其其他比率的等价物计算得出的。在图7b中,我们绘制了市场(MM)、集群(CM)和互动(IM)对记忆效应的贡献,作为整体记忆的百分比。剩余部分是贡献者无法解释的剩余内存百分比。对于左列,对第12组中的所有股票计算该值,对于右列,对第22组中的所有股票计算该值。等权模式为美国ed.0 5 10 15 20 25 30集群号汽车和零件银行基本资源计划建筑和材料金融服务食品和饮料健康护理工业商品和服务保险业石油和天然气个人和家居用品Real EstateTailtechnologyTelecommunicationsTravel&LeisureUtilities图8:DBHT集群在ICB超级部门的组成。x轴标记胸径T的簇,y轴是每个簇中的种群数量。颜色代表键中给出的特殊性B超反射。因子模型是选择那些对其集群内股票的记忆有显著减少(第5.1节所述)的股票。表2总结了该程序的结果,在第一列中报告了聚类数k(由DBHT算法给出)。第二列包含每个集群中的股票数量,第四列显示了集群模式是否显著减少了该集群中股票的内存。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 11:43