人大经济论坛 › 论坛 › 经济学人二区 › 外文文献专区 › 高维金融时间序列相关性建模

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: nandehutu2022

449 40

[量化金融] 高维金融时间序列相关性建模 [推广有奖]

31楼

何人来此

发表于 2022-5-26 15:29:27 |只看作者 |坛友微信交流群

然而，可以看出，许多资产，尤其是健康公司，出现在与其行业同行不同的集群中。我们认为，这是CDCV模型聚类方法的一个关键好处：在任何时间内，不同行业集团的资产都可能形成集群，但我们预计，在相关学习期间，它们的行为会更加密切相关。图15：使用2005年1月1日至2008年12月18日期间的每日收益率、基于Kendall Tau的距离度量和适用的单链接标准对15个集群进行分解。3.8敏感性分析我们接下来分析CDCV模型性能对其结构变化的敏感性。这是这些简化的vine copula模型的一个方面，现有文献尚未解决，尽管这是此类模型可用性的基础。我们在此不提供详尽的分析，而是提供初步的探索性结果，表明这些考虑是重要的，并且可能确实对模型性能产生重大影响。图16：集群数量3≤ N≤ 18，我们绘制了分位数q1、q25、q50、q75、q99以及在CDCV模型的vine copula的所有节点上条件化后剩余的二元秩相关分布的标准偏差。我们还绘制了剩余绝对秩相关的等效值。

使用道具举报

32楼

大多数88

发表于 2022-5-26 15:29:30 |只看作者 |坛友微信交流群

这些汇总指标都是通过平均从2005年1月1日至2008年12月18日的50个时间步模型拟合中获得的等效指标、150天的学习期、噪声参数为Υ=11的vol加权指数、自适应单链接标准和基于Kendallτ的距离指标得出的。在图16中，我们使用与上述分析中相同的参数设置来实现CDCV模型，但还改变了我们从62 assettime系列构建的集群数量。为了便于实施，我们对每个参数组合进行了50个时间步长的抽样，并对结果进行平均。该图表明，在应用联合简化多元copula之前，该数据集使用的聚类数对vine模型拟合后剩余相关性的标准偏差有重大影响。在仅使用三个集群的情况下，该标准偏差从使用15个集群获得的最小值0.093上升至0.12，表明模型性能随着集群大小的增加或集群数量的减少而恶化。这些结果还突出表明，当最小聚类大小减小（即聚类数量增加）时，我们试图用指数噪声参数最小化的高负相关性更为普遍。此类发现表明，市场部门藤蔓copula模型的聚类或分组对模型性能有重大影响，应在该领域的未来研究中予以考虑。图17：噪声参数6≤ Υ≤ 15，我们绘制了分位数q1、q25、q50、q75、q99以及在CDCV模型的vine copula的所有节点上条件化后剩余的二元秩相关分布的标准偏差。我们还绘制了剩余绝对秩相关的等效值。

使用道具举报

33楼

能者818

发表于 2022-5-26 15:29:33 |只看作者 |坛友微信交流群

从图16中描述的相同设置中获得结果，但对15个集群有额外的要求。在图17中，我们接下来改变用于构建索引的噪声项的比例。鉴于（8）中定义的噪声参数Υ=1/λ，我们观察到→ ∞ 因此我+→ 我认为，由于资产和指数时间序列之间的相似性，我们存在高度负相关。通过引入越来越大的扰动，我们抑制了高负相关性，但我们也失去了在我们的集群中调节高正相关性的一些能力。图17表明，该数据集的最佳噪声参数范围为9≤ Υ≤ 11并说明，对于抑制最极端负相关所需的噪声参数范围，随机噪声项对保持二元秩相关的标准偏差的有害影响最小。4调查结果和进一步研究领域的讨论上一节中的分析表明，拟议的CDCV模型是在金融环境中建模高维依赖结构的可行选择，尤其是与[9]的原始CAVA模型相比，它能够提供更高的灵活性和更高的性能。不使用外部来源的指数时间序列就可以获得这些结果，这清楚地表明，未来的研究不需要，也不应该将其分析局限于特定的构造或数据集，以实现简化的vine copula模型。我们的分析表明，使用市场上可用的外部指数对聚类结构施加的限制对此类vine copula模型的性能有重大影响。

使用道具举报

34楼

大多数88

发表于 2022-5-26 15:29:36 |只看作者 |坛友微信交流群

特别是，我们已经表明，将数据集划分为集群的方式、使用的集群数量以及构建部门/市场指数的方法都会影响模型捕获依赖性的能力。鉴于【9】使用十个几乎相同规模的行业部门测试了他们的CAVA模型，并且【5】使用五个不同规模的基于国家的分组测试了他们的RVMS模型，我们在一个数据集上测试了DCV模型，从该数据集可以在每个给定的时间步内形成可变或固定数量的集群。我们已经证明，较小的簇大小更适合捕获大多数二元秩相关，这些小簇倾向于在模型中引入负相关性，并且在实践中可以通过在索引构建过程中添加一个小扰动来缓解这一问题。虽然我们只是粗略地分析了哪些聚类规则提供了最佳的模型性能，但这种方法为进一步分析打开了一个数字区域。关键的是，我们还表明，这些模型的性能并不是随时间而恒定的。虽然这似乎是一个显而易见的结论，但迄今为止，这些模型的一个方面尚未在文献中得到充分论述。CDCV模型的应用明显比其扩展的市场部门模型的应用更加多样化，这主要是因为它从基础数据中抽象出建模框架。虽然CDCV模型使用了与[9，5]和[11]的双因素copula模型相同的层次结构，但其主要贡献是包含了一种聚类机制，使其适用于所有数据集。

使用道具举报

35楼

何人来此

发表于 2022-5-26 15:29:39 |只看作者 |坛友微信交流群

这是市场部门和因子copula模型结合的逻辑下一步，并继续从数据中提取高维vine copula建模框架的主题，正如[18、6、13]所追求的那样。这种抽象使CDCV模型适用于任何一组非自变量的分析，尽管我们预计它最适合于可能在多个维度上表现出聚类的数据集，例如全球股票投资组合。在这种金融环境下，copula已经被用于多种目的；例如，对一篮子股票之间的相关性进行建模，或者对资产组合的预期回报进行建模和模拟。计算上可行的vine copula模型反过来可以提供比市场标准方法（如多元copula或简单协方差矩阵）明显的改进。全藤copula模型已经被证明能够展示这种改进的一个目的是优化高维股票投资组合。例如，[17]表明，基于Clayton C-Vine copula模型的CVaR优化投资组合在投资组合或10项或更多资产上的表现优于等价的多元Clayton copula模型。虽然作者提出了完全实现的vine copula，但我们研究的一个自然扩展将是评估传统vine copula模型（如CDCVmodel和[18、6、11]的模型）的扩展是否能够提供足够的精度，以便实际实现此类投资组合优化。参考文献[1]K.Aas、C.Czado、A.Frigessi和H.Bakken。多重依赖的成对copula结构。《保险、数学和经济学》，44（2）：182–198，2009年。[2] H.Akaike。统计模型识别的新视角。IEEE自动控制交易，19（6）：716–7231974年12月。[3] 贝德福德和库克。

使用道具举报

36楼

能者818

发表于 2022-5-26 15:29:42 |只看作者 |坛友微信交流群

Vines–相依随机变量的新图形模型。《统计年鉴》，30（4）：1031–10682002年8月。[4] E.C.布雷希曼。层次Kendall copulas：性质和推理。《加拿大统计杂志》，42（1）：78–1082014。[5] E.C.布雷希曼和C.查多。高维葡萄系带的风险管理：对欧洲斯托克50指数的分析。《统计与风险建模》，30（4）：307–3422013。[6] E.C.布莱希曼和H.乔。使用截断藤蔓和因子分析对相关矩阵进行简约参数化。计算统计与数据分析，77（0）：233–252014。[7] U.Cherubini、E.Luciano和W.Vecchiato。金融学中的Copula方法。威利金融系列。Wiley，2004年。[8] B.S.Everitt、S.Landau和M.Leese。聚类分析。霍德·阿诺德的出版物。泰勒和弗朗西斯，第4版，2001年。[9] A.Heinen和A.Valdesogo。大维度的非对称CAPM依赖：标准藤自回归Copula模型。SSRN电子杂志，2008年。[10] H.乔。具有给定裕度和[…]的m-变量分布族二元依赖参数。IMS课堂讲稿-专著系列，28（c），1996年。[11] H.乔。使用Copulas进行依赖建模。查普曼和霍尔/CRC，2014年。[12] H.Joe和J.J.Xu。多元模型边际推理函数的估计方法。《第166号技术报告》，不列颠哥伦比亚大学统计系，第1-21页，1996年。[13] P.Krupskii和H.Joe。多元数据的因子Copula模型。J、 Multivar。分析。，2013年9月120:85–101日。[14] P.Kupiec。验证风险度量模型准确性的技术。《衍生杂志》，3:73–841995年。[15] D.Kurowicka和H.Joe。葡萄藤的最佳截断。《独立建模：VineCopula手册》，第233-247页。新加坡：世界科学出版社，2011年。[16] D.X.李。

使用道具举报

37楼

nandehutu2022

发表于 2022-5-26 15:29:45 |只看作者 |坛友微信交流群

关于默认相关性：Copula函数方法。SSRN 1872891999提供。[17] R.K.Y.Low、J.Alcock、R.Faff和T.Brailsford。现代投资组合管理背景下的规范藤蔓连接函数：它们值得吗？《银行与金融杂志》，2013年3月。[18] A.K.Nikoloulopoulos和H.Joe。项目响应数据的因子Copula模型。《心理测量学》，第1-25页，2013年。[19] F.鲑鱼。灾难秘诀：扼杀华尔街的公式。《连线》杂志，2009年。[20] R.Shahid、S.Bertazzon、M.L.Knudtson和W.Ghali。卫生服务规划空间分析模型中距离度量的比较。BMC健康服务研究，2009年1月9:200。【21】A.斯卡拉。尺寸和边缘的再划分功能。公共。统计研究所。巴黎8号，第229-231页，1959年。定义和算法A。1聚类规则-距离度量文献中常见的距离度量选择。请注意，xi，jis是平均值xi，jvalue，A是一致对的集合，B是不一致对的集合，yi，jt是从原始xi，jvalue导出的ranked变量的集合。距离度量（D）=D（xi，xj），对于一对向量xi，xjeach，T时间步长seuclidean=qPTt=1（xi）t- （xj）t曼哈顿=PTt=1 |（xi）t- （xj）t | Pearson’s-based=vuuut2·1.-PTt=1（xi）t-xi（xj）t-(R)xjrPTt=1（xi）t-xiPTt=1（xj）t-(R)xjKendalls Tau基=s2·1.-PTt=1A（xi，xj）t-PTt=1B（xi，xj）tn（n-（1）Spearmans Rho-based=Vuut2·1.-PTt=1（一）t-\'\'易（yj）t-(R)yjrPTt=1（一）t-\'\'易PTt=1（yj）t-(R)yj表A1：凝聚聚类A的距离度量。2聚类规则-链接标准该表突出了文献中使用的最常见的链接标准，以及我们介绍的自适应单一标准。

使用道具举报

38楼

能者818

发表于 2022-5-26 15:29:49 |只看作者 |坛友微信交流群

请注意，Xp、xqmey可以是singletonelements，也可以是大小大于1的进行中集群，其中所有非singleton集群对的集合由Ohm, 最大簇大小由参数a设置，最大簇数由参数b设置，给定链接后存在的簇数由Xn表示。链接标准=P（Xp，Xq），待链接，给定元素xi，xjin集群Xp，XqSingle=minXp，Xqmini，j{d（xi，xj）：xi∈ Xp，xj∈ Xq}完成=minXp，Xqmaxi，j{d（xi，xj）：xi∈ Xp，xj∈ Xq}平均值=minXp，Xq|Xp | | Xq | Pxi∈XpPxj∈Xqd（xi，xj）自适应单=minXp，Xqmini，j{d（xi，xj）：xi∈ Xp，xj∈ Xq}：，[Xp，Xq]/∈ Ohm, Xp<a，Xq<a，Xn≤ b表A2：凝聚聚类A的连锁标准。3聚类算法-自适应单此伪代码用于一般聚集聚类算法。生成的群集集已取消Ohm, 其中，R是预先定义的停止规则，l（）是链接标准，d（）是距离度量。Lx，yis是根据链接标准从簇x和簇y中选择的一对（可能衍生的）时间序列，Dx，yis是Lx，y之间计算的距离。

使用道具举报

39楼

能者818

发表于 2022-5-26 15:29:51 |只看作者 |坛友微信交流群

最后，kOhmk是所有簇集的大小。资产聚类算法选择n个资产时间序列ai；i=1。。。，nm=选择m簇Ck={ai；ai∈ Ck}；k=1。。。，m；i=1。。。，nq=0将R=F也设置为z← 1、2、3。。。Ohm = {Ck；Ck6=0}计算停止规则Rif R=T RUE或kOhmk=1，然后停止，如果R=F，则停止x← 1，2。。。，m+Q或y← 1，2。。。，m+qif Cx=0或Cy=0Dx，y=∞+elseLx，y=l（Cx，Cy；）Dx，y=d（Lx，Ly）end-ifend-forend-forJx，y={[x，y]；Dx，y=min{Dx，y}}}Cm+1+q=CJx+CJyq=q+1CJy=0CJx=0end-ifend-forOhm = {Ck；Ck6=0}表A3：assetsA凝聚聚类的伪代码算法。4指数构建——第2.2节中考虑的n个Ttimesteps资产时间序列集群的指数构建方法示例，其中Mi是固定时间点资产i的市值，τTi是包含资产i的集群内所有双变量对的Kendallτ值之和，d是一个任意定义的参数，它增加了给定权重的严重性，σTi是资产的波动性。我们还将X定义为包含n列向量xt，…，的矩阵。。。，xtneach长度等于使用的学习周期。索引=Ixt。。。，xtn公司, t型∈ （1，T）简单平均值=Pni=1xtin“市值”加权平均值=Pni=1（mixti）Pni=1mi“Kendall的Tau之和”加权平均值=Pni=1（τti+d*（τti-min{τti}）xti）Pni=1（τti+d*（τti-min{τti}），“波动率”加权平均值=Pni=1（σtixti）Pni=1σti1st主成分=X.arg maxqwq=1nwTXTXwwTwo！表A4：部门和市场指数的构建方法a。5 C-Vine模型拟合算法我们根据【1】提供的算法，为使用这些函数的通用C-Vine copula拟合算法提供以下伪代码。

使用道具举报

40楼

何人来此

发表于 2022-5-26 15:29:55 |只看作者 |坛友微信交流群

在该算法中，我们获得通过i和k索引的n个时间序列之间的固定二元copula的向量qik（ψik，Θik，Lik），其中每个元素qik包含选定copula族ψik，以及一组固定参数Θik和对数似然Lik。这些值是通过应用程序包{copula}中的函数fitcopula（）和程序包{stats}中的函数AIC（）获得的，这两个函数对已经通过适当的概率积分变换到U[0，1]空间的时间序列执行第2节中所述的双变量拟合过程。在这个C-Vine copula的模型拟合算法中，我们在每次迭代期间通过AIC在I copula族之间进行选择。C-葡萄藤装配介绍xi；i=1。。。，U[0，1]上的n个时间序列向量适用于i← 2，3。。。，n适用于k← 1，2。。。，我-1对于c← 1，2。。。，Iqcik（ψcik，θcik，lcik）=fitCopula（xi，xk；ψcik=c）acik=AIC（θcik，lcik）end forCik={cik；AIC（θcik，lcik）=min[acik]}Qik（ψik，Θik，Lik）=qCikxi=hψik（xi，xk；Θik）end forend forTable A5：设置完整c-Vine copulaA的伪码算法。6 C-Vine模拟算法为了从C-Vine进行模拟，我们从每个资产返回变量的随机样本wiof数据开始，然后通过Vine的每棵树迭代“取消条件”样本，根据需要在每一步应用“逆h函数”，以获得前一个条件变量的值。这本质上是我们的C-Vine拟合算法的反向版本，并为我们提供了一个来自Vine copula的样本，用向量x表示。以下C-Vine copula的模拟算法符合[1]。

使用道具举报