楼主: nandehutu2022
934 40

[量化金融] 高维金融时间序列的依赖性建模 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-5-7 20:45:26
为了实现资产和集群的重复连接,我们可以使用附录a中提供的集群算法。3.这样的算法可以通过在算法或规则本身中引入可配置的参数来控制;例如,为了确保最小的集群大小,固定或可变的集群数量,等等。图2:受基于高度的切割规则约束的9个资产的聚集聚类方法的图解表示。虽然欧几里德距离可能是聚类文献中最常用的距离度量(请参见[20,8,4]以了解概述),但我们更倾向于使用秩相关度量来完成这项任务,因为我们希望对证明最依赖性的时间序列数据进行分组。就我们采用的联系标准而言,选择在很大程度上取决于我们希望产生的集群类型。例如,平均链接标准旨在连接具有较小簇内方差的簇,并且与许多其他方法相比,受极值的影响往往较小。或者,完全连锁标准可能会受到中等偏外值的显著影响,并倾向于产生半径近似相等的紧凑集群。在我们对CDCV模型的分析中,我们将主要选择使用我们引入的自适应单连锁标准,包括附录A中给出的通用聚集聚类算法中未包含的一些附加规则。3.该标准类似于标准的单链接标准,但它还将任何给定簇的大小限制为参数化的最大元素数,将簇的总数限制为参数化的最大值,并忽略两个元素均为非单元素簇的潜在连接。

12
mingdashike22 在职认证  发表于 2022-5-7 20:45:29
实施此最终限制是为了避免链结,这可能是单链结算法的一个问题,其中每个链结覆盖的距离很短,但群集中最相似的元素可能最终彼此相距很远。在这一点上,我们可以认为链接标准不仅是决定合并哪些集群的规则,而且是引入额外条件的一种手段,可以更好地控制最终集群的大小、形状和组成。虽然CDCVmodel的动态聚类方法显然非常直观、随时间变化,并且在概念上比固定的部门聚类方法有所改进,但应该指出的是,进一步的研究领域仍然是开发优化的聚类方法。2.2从资产中导出层次索引CDCV模型在给定时间步长内聚集到特定分组中的资产可能无法立即由现有索引表示。因此,我们使用了一种通用的指数衍生方法,如图3所示,从中我们可以为每个聚类构造指数,作为模型中的潜在变量。虽然有许多可能的方法可以用来推导这些潜在变量,我们将根据这些潜在变量来调整资产,但我们更喜欢通过时间提供相对稳定的聚类指数的方法。图3:CDCV模型中导出聚类指数的方法的图解。

13
kedemingshi 在职认证  发表于 2022-5-7 20:45:32
然后,市场指数可以直接从集群指数或直接从所有资产集合中导出。我们在附录A.4中概述了金融行业中使用的一些基本但常用的指数构造规则(表示为I(·)),并将其与εt给出的正态分布随机变量“噪声”向量相结合~ N0,λ·max | Ixt。。。,xtn|, (7) 式中,Υ=λ是一个噪声参数,我们用它来调整引入的扰动的规模。这使我们能够在每个时间步asI中确定噪声调整指数+xt。。。,xtn= 我xt。。。,xtn+ εt.(8)该噪声项纠正了直接从少量资产时间序列构建指数,然后将这些时间序列调整为结果指数的过程中产生的问题。当集群规模较小时,我们可能会在我们的模型中引入高水平的负相关性,因为指数太完美地代表了两个资产时间序列之间的中间路径。正如我们将在第3节中展示的,该噪声项足以抑制产生的负秩相关性,同时仍能有效地捕捉基础资产时间序列数据中的正相关性。虽然此类指数结构的优化是另一个有待进一步研究的领域,但我们将在第3节中证明,只要对这个问题给予最少的关注,我们就能够构建足够好的指数,以获得优于利用CAVA模型结构的等效模型的模型拟合结果。2.3实现CDCV模型为了实现本文定义的CDCV模型,我们使用统计编程语言R建立了一个建模结构和测试框架。

14
可人4 在职认证  发表于 2022-5-7 20:45:35
我们已经更新了[9]中描述的算法,为CDCV模型(我们在附录A.7和A.8中提供)的裕度(见[12])模型拟合和模拟算法提供了推理功能。在这些算法中,我们使用Kaike信息标准(AIC,根据[2])在正态分布、Student\'s-t分布和倾斜Student\'s-t分布之间进行选择,以确保我们能够捕捉金融资产收益时间序列的特征,如过度倾斜和峰度。我们还限制了我们自己的同节律边缘分布,这与[17]一致,他们观察到,引入拱型边缘对他们的葡萄藤copula聚焦Portfolio优化分析的结果没有明显影响。一旦我们确定了边际分布,我们将边际数据转换为单位超立方体。对于资产加市场指数的每一个二元组合,我们通过[7]asl(Θ;x,x)=mXi=1logΘCΘ(F(xi,1),F(xi,2))给出一般性,从而最大化所选二元copula族的二元对数可能性-mXi=1Xj=1log fj(xi,j),(9),其中“CΘ”是为每种三次调用的copula类型定义的copula密度。边际分布的集合是^Ohm = ^ψ={F(x;^z),F(x;^z),…,Fm(xm;^zm)},(10)估计的边际密度的结果集是^ψ={F(x;^z),F(x;^z),…,fn(xm;^zm)},(11)其中^z={^z,…,^zm}是估计的边际参数集。注意,(9)的第二项不依赖于copula参数,因此对于IFM方法,我们只需要最大化第一项。高斯、Student\'s-t、Clayton和Frank copula家族的对数概率使得AIC能够再次选择最适合的二元copula。

15
能者818 在职认证  发表于 2022-5-7 20:45:37
然而,建模C-Vine copula还要求我们在Vine中的每个二元copula被拟合后应用h函数(13),以便将用于拟合copula的样本数据转换为另外以当前根节点为条件的样本数据,用于在下一棵树中拟合条件二元copula。这些h函数是vinecopula条件分布函数的简化形式,由[10]和[9]asFn | n给出-1(xn | xn-1) =Cn,(n)-1) j |(n)-1)-JFxn | x(n-1)-J, Fx(n)-1) j | x(n)-1)-JFx(n)-1) j | x(n)-1)-J, (12) 为了方便记法c在哪里-jis定义为向量c,但不含分量j,其中n- 1可以用来表示一个字符串,该字符串由之前的条件变量索引组成,最大值为该值。[10]之后,h函数可以写为ash(xn,xn-1,θ)=Fn |n-1(xn | xn-1)=Cθn,(n)-1) [F(xn),F(xn-1)]F(xn)-1) ,(13)式中,F(·)表示已在早期树的根节点上连续条件化的边缘分布。在(13)中,xnand xn-1是单变量的(实际上是统一的),并针对每个copula家族进行定义(见[9]中的表格)。此外,θ表示在n和n之间的copula族的copula参数- 1) thnodes(在节点1到n的条件之后)- 2). 我们可以推广这种迭代条件,并表示每[1,9]asc12的n维ALC-Vine copula密度。。。n[F(x),F(x),…,Fn(xn)]=n-1Yj=1n-jYk=1cj,j+k | 1,。。。,J-1[F(xj | x,…xj-1) ,F(xj+k | x,…xj-1) ,(14),其中j=1表示没有条件作用。等价地,我们可以将C-Vine copula的slog-似然函数表示为l(x,…,xn;θ)=n-1Xj=1n-jXk=1τXt=1logcj,j+k | 1,。。。,J-1[F(xj,t | x1,t,…xj-1,t),F(xj+k,t | x1,t,…xj-1,t)], (15) 其中θ是C-Vine的参数集,为了简单起见,我们假设我们正在拟合包含τ独立观测值的时间序列。

16
能者818 在职认证  发表于 2022-5-7 20:45:40
等式(15)说明了C-葡萄藤的对数似然度可以分解为两变量对数似然度之和。有鉴于此,我们可以实现一种算法,首先通过最大化其各自的对数似然度在葡萄树的每棵树中定义无条件二元copula,然后通过使用per(13)的h函数迭代转换观测数据,在后续树中解释必要的条件。我们在附录A.5中提供了一个通用C-Vine copula fitting算法的伪代码,该算法利用h函数,并根据其AIC统计,基于[1]提供的算法选择copula。图4:CDCV模型中第一棵树的图示。附录A.7中还提供了CDCV模型的拟合算法,该算法循环遍历每个聚类,首先拟合聚类指数到市场指数的无条件连接函数,其次拟合资产到市场指数的无条件连接函数。如图4所示,该过程完成了CDCVmodel的第一棵C-Vine树。在此过程中,我们使用AIC选择的copula族的固定参数和适当的h函数变换聚类指数和资产时间序列。图5:CDCV模型中后续树的图解表示,使用ClusterIndex作为根节点。CDCV模型的拟合算法是基于[9]方法的C-Vine算法的简单扩展。CDCV算法和C-Vine算法之间的主要区别在于,CDCV算法在设置了特定数量的树(即,它是一个简单的C-Vine)后,会生成一个多元copula,它结合了聚类的概念,并结合了元素和来自其他聚类的索引之间的独立性假设。

17
大多数88 在职认证  发表于 2022-5-7 20:45:43
在确定DCV模型的第一棵树后,我们在每项资产及其相关的集群指数(即,以市场指数为条件)之间建立条件连接,如图5所示。图6:CDCV模型联合简化多变量种群的图解表示。最后,我们将Student\'s-t或Gaussian多元copula映射到条件资产,如图6所示。C-Vine模拟算法的类似调整(见附录A.6)使我们能够轻松地从CDCV模型进行模拟,详见附录A.8.3分析、结果和结论,以证明我们的CDCV模型能够提供改进的结果,超过文献中的固定层次模型,我们实施了Heinen&Valdesogo CAVA模型的第一个版本,该模型在第2.3节所述的边际分布、二元连接函数和多元连接函数之间进行选择。然后,我们通过将外部来源的标准普尔500指数与第2.2节概述的CDCV模型的衍生指数进行替换来实施CDCV模型,然后也放松固定的聚类结构,并允许其根据第2.1.3.1节详述的聚类方法随时间而变,以测试具有不同大小的聚类的CDCV和CAVA实现,我们选择了标准普尔500指数和10个行业指数,以及[9]分析的95项资产中的62项。H&V行业市值最大的5支股票2008年6月市值最小的5支股票2008年6月能源XOM CVX COP SLB OXY RDC Tsoin Industrial GE UTX BA MMM CAT PLL R CTA RHIHEALTH JNJ PFE MRK ABT PKI THC金融BAC JPM AIG WFC HBANUTILITIES EXC SO D DUK TEG PNW CMS GASSMATERIERS DD DOW AA PX NUE IFF BMSCONS DISC MCD CMCSA DIS HDCONS PG WMT KO PEP BF CVS。BIT MSFT IBM AAPL CSCO INTCTELECOM T VZ CTL1:我们用于分析CDCV模型的资产的详细信息。

18
kedemingshi 在职认证  发表于 2022-5-7 20:45:46
Heinen&Valdesogo使用了95种资产中的62种来测试他们的CAVA模型,并为我们提供了每个行业股票数量的变化。对于这些股票和指数,我们从彭博社2005年1月1日至2008年12月18日的每日回报值中获得,以分析最近金融危机之前和期间的表现。图7:2005年8月8日至2008年12月18日(即不包括最初的150天学习期)期间,表1中62项资产的平均加权投资组合的每日和累积相对回报PnL。该数据如图7所示,显示了62个边际投资者的加权投资组合的每日和累积相对回报率,平均每日回报率为0.00002%,avariance为0.00052%。这些资产回报率均值的分布如图8所示,并清楚地表明资产回报率中存在负偏差。我们还注意到这62个边缘分布的平均峰度为12.48,最小峰度为3.416,这强烈表明我们有非高斯边缘。图8:62个相对资产收益率均值、最大值、最小值、方差、偏斜和峰度的分布,其中每个边际分布的统计数据直接来自2005年8月8日至2008年12月18日之间的数据(即,不包括最初的150天学习期)。图9:62名边缘人的相对论中的平均值(黑色)和分位数(灰色)q1、q25、q50、q75、q99基于150天的滚动学习期,通过时间回归均值、方差、偏斜和峰度统计。在下面的分析中,我们还对CDCVand CAVA模型的时变性能感兴趣;[9]或[5]或相关文献均未直接论述市场部门模型绩效的一个方面。

19
mingdashike22 在职认证  发表于 2022-5-7 20:45:49
为了支持这一分析,我们在图9中展示了图8中的边际数据统计的时间依赖性变化。我们特别感兴趣的是每个分布统计的第1和第99个分位数,因为它们可能是我们可能做出的任何边际假设中最严重的部分。

20
nandehutu2022 在职认证  发表于 2022-5-7 20:45:52
图9还验证了我们使用Student\'s-t分布来捕捉边缘的多余峰度,以及使用Skew Student\'s-t分布来捕捉多余的Skew。3.2模型拟合性能为了证明CDCV模型更普遍的结构能够优于CAVA模型的刚性层次结构,我们首先在这里复制[9]采用的主要性能分析指标,然后扩展分析以考虑模型性能的其他方面。二元秩相关分布条件模型平均Std发展q1 q25 q50 q75 q99None均为0.3506 0.1258-0.0246 0.2671 0.3474 0.4291 0.8597市场CDCV 0.0022 0.1575-0.4387-0.0971-0.0037 0.0860 0.7638CAVA 0.0116 0.1505-0.4060-0.0814 0.0009 0.0841 0.7782市场+集群CDCV-0.0023 0.0936-0.4319-0.0625-0.080.0860-0.080.080.080.050.0935市场+0.080.080.950-00.0020.0642 0.3657(绝对)二元秩相关分布条件模型平均Std Dev q1 q25 q50 q75 Q99市场+集群CDCV 0.0733 0.0583 0.0001 0.0287 0.0607 0.1040 0 0.4670市场+部门CAVA 0.0747 0.0587 0.0001 0.0296 0.0625 0.1065 0.4981表2:所有二元资产相关性的分布统计,在将CAVA和CDCV(聚类=15,噪声参数Υ=11)模型设置为150天滚动学习期时所采用的调节过程的不同阶段。图10:资产之间的所有双变量斯皮尔曼Rho秩相关分布,在将CAVA和CDCV模型拟合到150天滚动学习期时采用的调节过程的不同阶段。在我们数据的每个时间步中,我们都将CDCV和CAVA的实施设定为每天150次的滚动学习期。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-29 05:23