楼主: 可人4
670 40

[量化金融] 高维金融时间序列相关性建模 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-13 18:56:58 |只看作者 |坛友微信交流群
为了执行资产和集群的重复连接,我们可以使用附录a中提供的集群算法。3、这样的算法可以通过在算法或规则本身中引入可配置的参数来控制;例如,为了确保最小的集群大小、固定或可变的集群数量,等等。图2:受基于高度的切割规则约束的9项资产的聚集聚类方法的图解表示。虽然欧几里德距离可能是聚类文献中最常用的距离度量(请参见[20,8,4]以了解概述),但我们更倾向于使用秩相关度量来完成这项任务,因为我们正在对证明最依赖性的时间序列数据进行分组。就我们采用的联系标准而言,选择在很大程度上取决于我们希望产生的集群类型。例如,平均链接标准旨在连接具有较小簇内方差的簇,并且与许多其他方法相比,受极值的影响较小。或者,完全连锁标准可能会受到中等程度的外围值的显著影响,并倾向于产生半径大致相等的紧凑集群。在我们对CDCV模型的分析中,我们将主要选择使用我们引入的自适应单连锁标准,包括附录A中给出的一般聚集聚类算法中未包含的一些附加规则。3、该标准类似于标准的单链接标准,但它还将任何给定簇的大小限制为参数化的最大元素数,将簇的总数限制为参数化的最大值,并忽略两个元素均为非单态簇的潜在连接。

使用道具

12
何人来此 在职认证  发表于 2022-6-13 18:57:01 |只看作者 |坛友微信交流群
实施此最终限制是为了避免链接,这可能是单链接算法的一个问题,其中每个链接覆盖的距离很短,但集群中最相似的元素可能最终彼此距离很远。在这种程度上,我们可以认为链接标准不仅是决定合并哪些集群的规则,而且是引入额外条件的手段,可以更好地控制结果集群的大小、形状和组成。虽然CDCVmodel的动态聚类方法显然非常直观、随时间变化,并且在概念上优于固定的部门聚类方法,但应该注意的是,进一步的研究领域仍然是开发优化聚类方法。2.2从资产中派生层次索引CDCV模型在给定时间步内聚类为特定分组的资产可能无法立即由现有索引表示。因此,我们使用图3所示的通用指数推导方法,从中我们可以为每个集群构建指数,作为模型中的潜在变量。虽然有许多可能的方法可以用来推导这些潜在变量,我们将根据这些潜在变量来调整资产,但我们更喜欢通过时间提供相对稳定的聚类指数的方法。图3:CDCV模型中导出聚类指数的方法的图示。

使用道具

13
何人来此 在职认证  发表于 2022-6-13 18:57:04 |只看作者 |坛友微信交流群
然后,可以直接从集群指数或直接从所有资产的集合中得出市场指数。我们在附录A.4中概述了金融行业中使用的一些基本但常用的指数构建规则(表示为I(·)),并将其与εt给出的正态分布随机变量“噪声”向量相结合~ N0,λ·max | Ixt。。。,xtn公司|, (7) 其中,Υ=λ是一个噪声参数,我们用来调整引入的扰动的规模。这使我们能够确定每个时间步asI中的噪声调整指数+xt。。。,xtn公司= 我xt。。。,xtn公司+ εt.(8)该噪声项纠正了直接从少量资产时间序列构建指数,然后将这些时间序列调整为结果指数的过程中产生的问题。当集群规模较小时,由于指数太完美地代表了两个资产时间序列之间的中间路径,我们最终可能会在模型中引入高水平的负相关。正如我们将在第3节中所示,该噪声项足以抑制产生的负秩相关性,同时仍能有效捕获基础资产时间序列数据中的正相关性。虽然此类指数结构的优化是另一个需要进一步研究的领域,但我们将在第3节中证明,只需对该问题稍加关注,我们就能够构建足够好的指数,以获得优于利用CAVA模型结构的等效模型的模型拟合结果。2.3实现CDCV模型为了实现本文定义的CDCV模型,我们使用统计编程语言R建立了一个建模结构和测试框架。

使用道具

14
可人4 在职认证  发表于 2022-6-13 18:57:07 |只看作者 |坛友微信交流群
我们更新了[9]中描述的算法,为CDCV模型(我们在附录A.7和A.8中提供)的裕度(见[12])模型拟合和模拟算法提供推理功能。在这些算法中,我们使用凯克信息准则(AIC,根据[2])在正态分布、Student-t和Skew-Student-t边际分布之间进行选择,以确保我们能够捕捉金融资产回报时间序列的特征,如过度倾斜和峰度。我们还限制了我们自己的同质边际分布,这与[17]一致,他们观察到引入拱型边际对他们的藤蔓copula聚焦Portfolio优化分析的结果没有明显影响。一旦我们确定了边际分布,我们将边际数据转换为单位超立方体。对于资产加市场指数的每一个双变量组合,我们通过[7]asl(Θ;x,x)=mXi=1log'CΘ(F(xi,1),F(xi,2)),最大化所选双变量copula族的双变量对数可能性-mXi=1Xj=1log fj(xi,j),(9),其中“CΘ”是为每种试验copula类型定义的copula密度。边际分布集为^Ohm = {F(x;^z),F(x;^z),…,Fm(xm;^zm)},(10)估计边缘密度的结果集是^ψ={F(x;^z),F(x;^z),…,fn(xm;^zm)},(11),其中^z={z,…,^zm}是估计边缘参数集。注意,(9)的第二项不依赖于copula参数,因此对于IFM方法,我们只需要最大化第一项。高斯、Student-t、Clayton和Frank copula族的对数似然性使得AIC能够再次选择最合适的二元copula。

使用道具

15
大多数88 在职认证  发表于 2022-6-13 18:57:10 |只看作者 |坛友微信交流群
然而,建模C-Vine copula还要求我们在拟合Vine中的每个双变量copula后应用h函数(13),以便将用于拟合copula的样本数据转换为额外以当前根节点为条件的样本数据,用于在下一棵树中拟合条件双变量copula。这些h函数是vinecopula条件分布函数的简化形式,由[10]和[9]asFn给出-1(xn | xn-1) =Cn,(n)-1) j |(n-1)-jFxn | x(n-1)-j, Fx(n-1) j | x(n-1)-jFx(n-1) j | x(n-1)-j, (12) 其中,为了便于注释c-jis定义为向量c,但不含分量j,其中n- 可以取1来表示一个字符串,该字符串是之前条件变量索引的最大值。在【10】之后,h函数可以写为ash(xn,xn-1,θ)=Fn | n-1(xn | xn-1)=Cθn,(n-1) [F(xn),F(xn-1)]F(xn-1) ,(13)式中,F(·)表示已在早期树的根节点上连续条件化的边缘分布。In(13)、xnand和xn-1是单变量(实际上是统一的),并针对每个copula族进行定义(见[9]中的表格)。此外,θ表示在n和n之间的copula族的copula参数- 1) thnodes(在节点1到n的条件之后- 2). 我们可以推广这种迭代条件,并将n维C-Vine copula密度表示为每[1,9]asc12。。。n[F(x),F(x),…,Fn(xn)]=n-1Yj=1n-jYk=1cj,j+k | 1,。。。,j-1[F(xj | x,…xj-1) ,F(xj+k | x,…xj-1) ],(14)其中j=1表示没有条件作用。等价地,我们可以表示C-Vine copula的slog-似然函数asL(x,…,xn;θ)=n-1Xj=1n-jXk=1τXt=1logcj,j+k | 1,。。。,j-1[F(xj,t | x1,t,…xj-1,t),F(xj+k,t | x1,t,…xj-1,t)], (15) 其中θ是C-Vine的参数集,为简单起见,我们假设我们正在拟合包含τ独立观测值的时间序列。

使用道具

16
能者818 在职认证  发表于 2022-6-13 18:57:13 |只看作者 |坛友微信交流群
方程(15)说明了C-藤的对数似然度可以分解为两变量对数似然度之和。有鉴于此,我们可以实现一种算法,首先通过最大化其各自的对数似然度在每棵树中确定无条件的二元copula,然后通过使用per(13)中的h函数迭代转换观测数据来说明后续树中的必要条件。我们在附录A.5中提供了通用C-Vine copula fitting算法的伪代码,该算法利用h函数并根据其AIC统计选择copula,基于[1]提供的算法。图4:CDCV模型中第一棵树的图示。附录A.7中还提供了CDCV模型的拟合算法,该算法循环遍历各个集群,首先拟合集群指数与市场指数的无条件连接函数,其次拟合资产与市场指数的无条件连接函数。此过程将构建CDCVmodel的第一棵C-Vine树,如图4所示。在这样做的过程中,我们使用AIC选择的copula族的固定参数和适当的h函数来转换聚类指数和资产时间序列。图5:CDCV模型中后续树的图解表示,将ClusterIndex作为根节点。CDCV模型的拟合算法是基于[9]方法的C-Vine算法的简单扩展。CDCV算法和C-Vine算法之间的主要区别在于,CDCV算法在设置了特定数量的树(即,它是一个简单的C-Vine)后,会生成一个多元copula,它融合了聚类的概念,并融合了其他聚类的元素和索引之间的独立性假设。

使用道具

17
何人来此 在职认证  发表于 2022-6-13 18:57:17 |只看作者 |坛友微信交流群
在构建DCV模型的第一棵树之后,我们在每项资产及其相关集群指数之间构建一个条件连接函数(即,以市场指数为条件),如图5所示。图6:CDCV模型联合简化多变量种群的图示。最后,我们将Student\'s-t或Gaussian多元copula拟合到条件资产,如图6所示。C-Vine模拟算法的类似调整(见附录A.6)使我们能够轻松地从CDCV模型进行模拟,详见附录A.8.3分析、结果和结论,以证明我们的CDCV模型能够提供改进的结果,超过文献中的固定层次模型,我们实施了Heinen&Valdesogo-CAVA模型的第一个版本,该模型在第2.3节所述的边际分布、二元copula和多元copula之间进行选择。然后,我们通过将外部来源的标准普尔500指数替换为第2.2节所述的CDCV模型衍生指数来实施CDCV模型,然后还放松固定的聚类结构,并允许其根据第2.1.3.1节所述的聚类方法随时间而变化,以测试CDCV和CAVA在不同大小的集群中的实施情况,我们选择了标准普尔500指数市场和10个行业指数,以及[9]分析的95项资产中的62项。H&V行业市值最大的5只股票2008年6月市值最小的5只股票2008年6月Energy XOM CVX COP SLB OXY RDC TSOINDUSTRIAL GE UTX BA MMM CAT PLL R CTAS RHIHEALTH JNJ PFE MRK ABT PKI THC Financial BAC JPM C AIG WFC HBANUTILITIES EXC SO D DUK TEG TE PNW CMS GASMENTERIALS DD DOW AA PX NUE IFF BMSCONS DISC MCD CMCSA DIS HDCONS STAP WMT KO PEP CVS。BIT MSFT IBM AAPL CSCO INTCTELECOM T VZ CTL表1:我们用于分析CDCV模型的资产的详细信息。

使用道具

18
大多数88 在职认证  发表于 2022-6-13 18:57:20 |只看作者 |坛友微信交流群
Heinen&Valdesogo使用了95种资产中的62种来测试其CAVA模型,并为我们提供了各行业股票数量的变化。对于这些股票和指数,我们从彭博社2005年1月1日至2008年12月18日的每日回报值中获得,以分析金融危机之前和期间的表现。图7:2005年8月8日至2008年12月18日期间(即不包括最初的150天学习期),表1中62项资产的平均加权投资组合的每日和累计相对回报PnL。该数据如图7所示,显示了62个边际投资者的加权投资组合的每日和累积相对回报,日均回报率为0.00002%,方差为0.00052%。这些资产回报率均值的分布如图8所示,并清楚地表明资产回报率中存在负偏差。我们还注意到,这62个边缘分布的平均峰度为12.48,最小峰度为3.416,这强烈表明我们有非高斯边缘。图8:62个相对资产收益率均值、最大值、最小值、方差、偏斜和峰度的分布,其中每个边际分布的统计数据直接来自2005年8月8日至2008年12月18日之间的数据(即,不包括最初的150天学习期)。图9:62名边缘人的RelativeASET的平均值(黑色)和分位数(灰色)q1、q25、q50、q75、q99返回平均值、方差、偏斜和峰度统计数据,基于150天的滚动学习期。在以下分析中,我们还对CDCVand CAVA模型的时变性能感兴趣;[9]或[5]或相关文献未直接涉及的市场部门模型绩效方面。

使用道具

19
可人4 在职认证  发表于 2022-6-13 18:57:23 |只看作者 |坛友微信交流群
为了支持这一分析,我们在图9中说明了图8中边际数据统计的时间依赖性变化。我们特别感兴趣的是每个分布统计的第1个和第99个分位数,因为这些可能是我们可能做出的任何边际假设中最严重的偏离。

使用道具

20
nandehutu2022 在职认证  发表于 2022-6-13 18:57:26 |只看作者 |坛友微信交流群
图9还验证了我们使用Student’s-t分布来捕获边缘的多余峰度,以及使用Skew Student’s-t分布来捕获多余的Skew。3.2模型拟合性能为了证明CDCV模型更普遍的结构能够优于CAVA模型的刚性层次结构,我们首先在这里复制了[9]采用的主要性能分析指标,然后扩展分析以考虑模型性能的其他方面。双变量秩相关分布条件模型平均Std Dev q1 q25 q50 q75 q99None均为0.3506 0.1258-0.0246 0.2671 0.3474 0.4291 0.8597市场CDCV 0.0022 0.1575-0.4387-0.0971-0.0037 0.0860 0.7638CAVA 0.0116 0.1505-0.4060-0.0814 0.0009 0.0841 0.7782市场+集群CDCV-0.0023 0.0936-0.4319-0.0625-0.0016 0.0588 0.3795市场+部门CAVA 0.0013 0.0950-0.4835-0.06060.0020 0.0642 0.3657(绝对)双变量秩相关分布条件模型平均Std Dev q1 q25 q50 q75 Q99市场+集群CDCV 0.0733 0.0583 0.0001 0.0287 0.0607 0.1040 0 0.4670市场+部门CAVA 0.0747 0.0587 0.0001 0.0296 0.0625 0.1065 0.4981表2:所有双变量资产相关性的分布统计,将CAVA和CDCV(聚类=15,噪声参数Υ=11)模型设置为150天滚动学习期时,在调节过程的各个阶段使用。图10:资产之间的所有双变量斯皮尔曼Rho秩相关分布,在150天滚动学习期内,将CAVA和CDCV模型拟合到条件化过程的各个阶段。在我们数据的每个时间步骤中,我们都将CDCV和CAVA的实施设定为150天的滚动学习期。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-14 17:20