楼主: nandehutu2022
1394 43

[量化金融] 因子的随机选择在一个特定的时间内保持了相关结构 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.2521
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-5-11 05:53:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Random selection of factors preserves the correlation structure in a
  linear factor model to a high degree》
---
作者:
Antti J. Tanskanen, Jani Lukkarinen, Kari Vatanen
---
最新提交年份:
2018
---
英文摘要:
  In a very high-dimensional vector space, two randomly-chosen vectors are almost orthogonal with high probability. Starting from this observation, we develop a statistical factor model, the random factor model, in which factors are chosen at random based on the random projection method. Randomness of factors has the consequence that covariance matrix is well preserved in a linear factor representation. It also enables derivation of probabilistic bounds for the accuracy of the random factor representation of time-series, their cross-correlations and covariances. As an application, we analyze reproduction of time-series and their cross-correlation coefficients in the well-diversified Russell 3,000 equity index.
---
中文摘要:
在高维向量空间中,两个随机选择的向量几乎是高概率正交的。从这一观察出发,我们开发了一个统计因子模型,即 Random_selection_of_factors_preserves_the_correlation_structure_in_a_linear_fact.pdf (401.55 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Presentation coefficients correlations Reproduction correlation

沙发
kedemingshi 在职认证  发表于 2022-5-11 05:53:23
因子的随机选择将线性因子模型中的相关结构保持在一个高度*, Jani Lukkarinen+,Kari Vatanen2018年12月27日摘要在一个非常高维的向量空间中,两个随机选择的向量几乎是高概率正交的。从这一观察结果出发,我们开发了一个统计因子模型,即

藤椅
大多数88 在职认证  发表于 2022-5-11 05:53:26
然后,在某些情况下,数据的高维性甚至可能是一种资产:在高维空间中,几乎任何一组随机向量都会产生几乎不相关的因子时间序列序列,可以用作线性因子模型的基础。1.2因子模型因子模型广泛用于金融应用中,以对资产回报进行建模(例如,见Campbell等人(1997)),并将其分解为风险因素的负荷。两种主要的因素模型是基本因素模型和统计因素模型。在基本因素模型中,目标是发现可观察的资产特征,例如财务比率和宏观经济变量,能够解释市场股价的行为,这些特征通常是设定时间序列的外在特征。*芬兰工业联合会EK,邮政信箱30(Etel–aranta 10),芬兰赫尔辛基FI-00131。电子邮件:安蒂。tanskanen@ek.fi+赫尔辛基大学数学与统计系,芬兰赫尔辛基伊利奥皮斯托FI-00014邮政信箱68,电子邮箱:jani。lukkarinen@helsinki.fiVarma互惠养老保险公司,邮政信箱1,FI-00098 Varma,Finland解释基本变量和经济变量之间可能存在高度相关性,这可能导致基本因素模型中的多重共线性。然后,基本因素模型预测的收益可能比观察到的收益更相关,这是在因素模型中包含特定风险成分的主要原因。统计因子模型是基本因子模型的常用替代方法。在统计因子模型中,因子是从资产收益中提取的。

板凳
可人4 在职认证  发表于 2022-5-11 05:53:29
主成分分析(PCA;参见Alexander(2001))是从资产时间序列中发现因素的统计技术的一个例子。当分析的d时间序列高度相关时,主成分分析可以很好地工作,这可能表明存在常见的驱动因素。PCA的应用包括利率期限结构、信用利差、期货和波动性远期模型。在主成分分析中,几个主成分通常具有直观的财务解释。在有序的高度相关系统中,第一主成分捕获所有变量中几乎平行的n个移位,通常被标记为公共趋势成分。第二个主成分捕捉变量中几乎线性的倾斜,而高阶主成分捕捉二次、三次等变化(参见Alexander(2009))。在股票市场中,高阶主成分可能经常(但肯定不总是)被解释为由不同的投资风格倾斜引起的市场波动。Stock和Watson(2002)表明,主成分分析在时间和横截面尺寸的限制下,为潜在因素提供了一致的估计。他们将具有非相关误差的经典因子模型的一致性估计推广到具有交叉相关和部分相关误差项的近似因子模型。经典的因素模型只包含少数几个因素。文献中最著名的fa c tor模型可能是资本资产定价模型(CAPM),该模型假设单一风险因素,即市场,驱动资产组合的回报(Sharpe,1964)。许多因素模型扩展了这一vie w(见Ross(1976);法玛和法语(1993年)。不断增加的不可计算能力使开发具有大量因子的模型成为可能。

报纸
mingdashike22 在职认证  发表于 2022-5-11 05:53:32
如今,因子模型在市场风险建模中很流行,例如,Barra模型(Grinold和Kahn,2000)依赖于手工挑选的市场因素来解释分析的金融工具的行为。Boivin和Ng(2006)证明,在某些情况下,使用较大数量的时间序列可能会导致比较小数量的时间序列更糟糕的因子估计。最近有大量文献被否决,以解决在时间序列数量比时间序列长度大的情况下进行一致性估计的问题(例如,Bun等人(2017年);Ledo it and Wolf(2012))。1.3因子的选择因子的选择明显影响因子模型解释投资组合投资风险的能力,尤其是当因子模型仅由几个精心选择的因子组成时。当因素数量与分析的时间序列数量相比较大时,选择哪些因素可能无关紧要,只要这些因素跨越足够大的样本空间。即便如此,在风险管理中,因素的相对重要性也往往很重要。然而,目前尚不清楚一组任意的因素能在多大程度上支持风险分析——或者至少描述风险。这就是我们在这项研究中分析的问题:随机选取一组因素,看看它是否能够再现数据及其相互依赖性。开发

地板
大多数88 在职认证  发表于 2022-5-11 05:53:36
(2000)),在科学应用(Liu等人,2006年)、数据压缩(Bingha m和Mannila,2001年)、图像压缩(Amador,2007年)和近似算法设计(Blum,2006年)中对身份数据的结构保持扰动。随机投影允许一个人在保留问题结构的同时,降低所研究问题的维数,通常是实质性的。从计量经济学的角度来看,随机预测可以看作是时间序列对几乎非自相关因素集合的预测,这些因素也被认为是非交叉相关的,如第2.1.4节相关结构和随机矩阵所示,投资组合中ris k的分析要求将单个工具的风险合并到投资组合的风险中。这可以通过依赖结构实现,例如相关矩阵。金融时间序列的依赖结构是现代投资理论的核心,这并非巧合(例如,Markowitz(1952))。最近可用数据的激增给时间序列分析带来了新的问题(例如,Bun等人(2017))。为了解决这些问题,需要新的分析方法。其中一个工具是随机矩阵理论(例如Edelman和Rao(2005))。在随机矩阵理论中,当问题的维数增加时,事情就会变得不那么复杂。许多研究已经应用随机矩阵理论来分析相关性。TracyWidom分布(Tracy和Widom,1996)给出了高斯正交系综中最大归一化特征值的分布。对于其他随机矩阵集合,也有该定理的版本(Tracy and Widom,199 4,1996)。Tracy-Widom分布是随机矩阵理论中普遍性的一个例子。

7
nandehutu2022 在职认证  发表于 2022-5-11 05:53:39
随机矩阵理论中普遍性的另一个重要例子是Marchenko-Pastur定律(Marchenko and Pastur,1967),它描述了协方差矩阵特征值的渐近分布。Laloux等人(1999年)认为,标准普尔500指数(s&P500)股票的相关矩阵的大部分特征值谱可以描述为噪声的产物,总共500个特征值中只有大约20个是信息量。更详细地说,Laloux等人(1999年)证明,标准普尔500指数收益的大部分功率谱与高斯正交系综产生的功率谱是无法区分的,其中渐近特征值分布由Marchenko-Pastur定律给出(Marchenko and Pastur,1967年)。由于高斯正交系综由r和OM矩阵组成,大部分功率谱可以解释为噪声e的产物。信息特征值可能对应于市场运动和行业,但大多数特征值谱不对应于线性因素。这表明ise在财务数据中对依赖结构的描述中不起重要作用。Plerou等人(1999年)表明,股价变化互相关矩阵谱中的大多数特征值与随机矩阵理论的普遍预测惊人地吻合。Malevergne和Sornette(2004)构建了一个模型,该模型的光谱显示了标准普尔500标准中的特征:几个大的特征值和一个大的部分。Malevergne和Sornette(2004)也指出了与因素相关的鸡和蛋问题:因素的存在是因为鸡和蛋是相关的;股票之所以相互关联,是因为影响它们的一个共同因素。

8
mingdashike22 在职认证  发表于 2022-5-11 05:53:44
他们认为,这些因素的明显存在是潜在时间序列自底向上的集体效应的结果。Ledoit和Wolf(2004)表明,简单使用样本协方差矩阵有缺点,样本协方差矩阵向结构化或常量矩阵的收缩减少了极值估计误差。在随后的工作中,Le doit和Wolf(2012)使用MarchenkoPastur定律进一步改进了结果。Bun等人(2017年)简要回顾了随机矩阵理论,然后展示了如何利用它缓解“大数据”问题。特别是,它们描述了当每个时间序列中的时间序列多于数据点时的相关矩阵估计问题。他们还提出了基于随机矩阵理论的补救措施,可用于改进相关矩阵的经验估计。鉴于上述例子,很明显,随机矩阵理论已经对金融时间序列的分析做出了贡献。我们利用随机矩阵建立了一个因子模型,并分析了一般线性因子模型中相关矩阵保持的性质。参数描述每个时间序列中数据点的数量n时间序列的数量,例如,等式因子的数量表1:使用的中心参数。1.5这项研究很大程度上是一个开放的问题,随机选择的因素是否可以用来描述一个大数据集,以及有多好。这是我们在本研究中探讨的问题。为此,我们建立了基于随机选择因子时间序列的因子模型,即

9
能者818 在职认证  发表于 2022-5-11 05:53:47
此外,随机选择的因子几乎是正交的,概率很高,如果进行适当的归一化,则它们应该是正交的。我们还展示了当因子数量增加时,随机因子模型如何向模型数据收敛,并且随机因子模型以高概率很好地保持成对相关性。本文结构如下。在第2节中,我们基于随机投影法建立了随机模型,并得出了描述该模型的理论结果(更多细节见附录A)。例如,我们证明了因子的随机性使得理论结果能够在模型的准确性上进行推导。作为随机因子模型的应用,第3节使用第2节中描述的因子模型分析了罗素3,00 0股票指数的相关关系矩阵。我们分析了随机因素模型复制股票对数收益时间序列及其相关性和协方差的能力。在单个时间序列水平和依赖结构水平上,随机因素模型中数据的复制与使用主成分分析获得的结果相比较。在第4节中,我们比较了不同的随机因素模型,并表明结果,而不是它们的准确性,是相当普遍的。在第5节中,我们将讨论结果及其可能的影响。在附录A中,我们证明了适用于Random因子模型的J-ohnson-Lindenstrauss样定理的一个版本。它给出了随机因子模型中相关和协方差保持精度的概率界。2随机因子模型el2。1时间序列Z:N的T d观测值→ R可以被视为d维空间Rd中的一个向量,其中时间序列的每个观测值都对应于向量的一个坐标。

10
大多数88 在职认证  发表于 2022-5-11 05:53:51
n个这样的时间序列的集合可以压缩到矩阵X中∈ Rd×N,其中观察值以列为单位。我们假设时间序列数据已经过预处理,因此每个时间序列的平均值为零,也就是说,对于每个b=1,…,PmXmb=0。。。,N.我们在这项研究中使用样本统计。均值u、方差σ和协变量C的定义为ux=ddXm=1xm、Cx、y=d- 1dXm=1(xm- ux)(ym- uy),σx=Cx,x,(1)式中x,y∈ Rd.本研究中使用的中心参数总结在表1.2.2线性因子模型中。线性因子模型将目标数据集描述为因子的负荷加权和(例如,McNeil等人(2015))。设F=[FF…Fk]∈ Rd×k包含因子j=1,2,k、 Fj∈ Rd×1。然后是时间序列Xb∈ Rd×1,其中Xbis b:矩阵X的第列,b=1。。。,N、 可以表示为因子荷载Lbj的乘积之和∈ R和因子Fj,即Xb=kXj=1LbjFj+b,(2)其中b是一种特殊风险成分。由于我们将观测值收集到o f X和f列中,公式(2)以矩阵形式写成X=f LT+。F中的因素可能在市场数据中可以直接观察到,也可能无法直接观察到。对于观察到的factortime系列,必须将数据投影到factors以获得lo adings。对于未观测到的时间序列,需要使用诸如PCA或其他类似优化的方法来查找因子及其负载。2.3随机投影使用随机投影法选择随机因子。随机投影的关键思想是基于约翰逊-林登斯特劳斯引理(约翰逊和林登斯特劳斯,1984年;宾厄姆和曼尼拉,2001年):如果高维空间中的点被投影到适当高维的随机选择的子空间上,那么点之间的距离大致保持不变。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 16:46