楼主: 大多数88
1285 41

[量化金融] 随机矩阵在资产波动相关性中的应用 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-5 01:45:10
特征值密度利用波动率相关矩阵(11),我们可以计算其特征值,并按λν(λ)λN0的顺序进行排序。00 0.01 0.02 0.03 0.04 0.050 5 10 150 118 2360 2图。2:(在线上色)我们绘制了波动率相关矩阵的特征值直方图。y轴是宽度为0.001的容器中特征值的频率。平滑图是RMT的分析结果(12)。这是通过拟合累积概率分布(15)中的数据点(14)来估计的。该函数的参数分别为q=2.351、s=0.09952±0.00005和α=0.3890±0.0014。我们进一步将估计图乘以系数(.001Pλ<λ+ν(λ)/α),以匹配y轴上的频率标度。(插图)我们表明,最大特征值λN=237比分布的大部分更大。λ如果(λi)N0=1610.00 0.01 0.02 0.03 0.04 0.050.0 0.1 0.2 0.3 0.4 0.5 0.6图。3:(彩色在线)阶梯函数是波动率相关矩阵特征值的经验累积概率分布(14)。平滑图是Q=2.351、s=0.09952±0.00005和α=0.3890±0.0014的分析系数(15)。为了生成该特征值,首先使用N=161个特征值,该边缘用垂直虚线显示。{λ,λ,…,λN},其中λ是最小的,λ是最大的特征值。特征值直方图如图2所示。首先我们注意到最小特征值λ=0.0015,这是正的。其次,分布的尾部正在平稳衰减,而不是突然终止。我们还注意到,最大特征值λNis约为237,远大于大部分分布中的值。这些观察结果与我们的样本数据集的特征相一致,在样本数据集中,市场被发现非常不稳定且具有强相关性。

12
何人来此 在职认证  发表于 2022-5-5 01:45:13
请注意,由于相关矩阵的轨迹被固定为N,当λN变大时,分布的峰值接近于零。为了拟合(12)中的大部分特征值分布,我们使用经验累积分布函数F(λi)=NNXj=1Θ(λi)- λj)。(14) 这里的Θ(λ)是Heaviside阶跃函数,我们在图3中绘制了F(λi)作为特征值的函数。因为只有一部分特征值是噪声,所以我们定义了F(λi)infm(λ)=αZλ的一部分-∞dλPRM(λ,s),(15),参数为sandα,保持Q=T/N固定。如图2所示,大量特征值不在大部分分布范围内。因此,当α仅与(14)中的部分经验累积分布F(λi)进行比较时,引入α来处理(15)中的归一化。此外,当多个特征值超出RMT时,有效标准偏差会发生变化。特别是,如果时间序列相关性较弱,则只有少数特征值大于λ+,这是RMT的理论界(13)。然后,有效标准偏差约为≈ 1.-NNXi=N+1λi,(16),其中Nis是属于Marcenko Pastur分布(12)的特征值的数量。为了将数据填入(15)中,我们首先在经验累积分布(14)中选择特征值{λ,λ,…,λN}和相应数据点的子集。然后我们将这些数据点填入(15)中,并通过最小化均方根误差(RMSE)来估计α和Sb。所选数据点的最小RMSE可表示为,E(N)=minα,svuutNNXi=1F(λi)- FRM(λi,α,s).(17) 我们将E(N)作为图4的函数。看来●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●N1E(N1)120 140 160 180 200●N1=1610.001 0.004 0.008图。

13
何人来此 在职认证  发表于 2022-5-5 01:45:16
4:(彩色在线)我们绘制了经验累积概率分布(14)的淹没点最佳RMT的均方根误差(RMSE)。当我们改变N时,我们在N=161时接近局部最小值。这一点由一条垂直虚线指出。在N=161附近,E(N)有一个局部最小值,超过这个阈值,E(N)开始几乎线性增加。通过这种方式,我们找到了一个用于拟合RMT结果(15)的“最佳”特征值数。请注意,Nis的值对设置程序和使用的指示器敏感。然而,噪声的精确分布有一条衰减的尾巴,而不是(12)中的锐利边缘。因此,Ndo的微小变化不会高估噪音。对于N=161,估计参数为s=0.009952±0.00005和α=0.3890±0.0014。利用(13),我们还估计λ-= .0012和λ+=0.0272。对于这些参数值,概率密度(12)如图2所示。最后,我们发现不存在=173个特征值,因此λi≤ λ+并且它们属于Marcenko Pastur分布。我们注意到,sandα的估计值接近于我们从(16)中得到的值,即s≈ 0.00429和α≈ N/N=0.4051。四、 在上一节中,我们研究了在Marcenko Pastur分布下哪些特征值可能是纯噪声。然而,时间序列很有可能包含真正的相关性,然后其分布与Marcenko Pastur分布非常相似。因此,我们进行了进一步的诊断测试,以确保由RMTlimits限定的特征值确实是噪声。由于相关矩阵是实对称矩阵,我们使用这些数据来评估零假设,即它属于RMT的GOE。

14
何人来此 在职认证  发表于 2022-5-5 01:45:20
为此,我们将NGEIGEN值之间的短期和长期相关性与GOE的分析结果进行比较。通过定义,随机矩阵的GOE有两个重要性质。首先,如果M是实对称矩阵,并且是GOE的一个元素,那么它的所有元素都是统计独立的。第二,系综在正交变换下是不变的。换句话说,元素M的任何变换→ 其中O是实正交矩阵,使得M元素的联合概率不变。由于这种对称性,GOE的元素表现出一些普遍的性质。由于这些性质中有一些是自平均的,我们可以通过研究一个单一的、大的元素来观察这些性质。特别是,我们通过计算展开特征值的最近邻和次近邻间距分布来研究短程相关性。我们还通过计算数字方差来比较特征值之间的长期相关性。即使对于少数落在RMT范围内的特征值,即N=172,我们也发现GOE的普遍性质非常一致。A.最近邻间距分布GOE的第一个测试是挥发性相关矩阵未展开特征值的最近邻间距分布。为了展开本征值,我们使用了高斯加宽技术,正如[26]中哈伯德模型中所使用的那样。高斯展开过程在附录A中进行了简要总结。我们考虑了理论界(13)内的所有Neigen值,并计算展开的特征值ξi。通过定义(A3),展开的特征值是λitoξ的映射,ξi为均匀分布。现在我们估计最近邻空间d=(ξi+1)的分布- ξi)如图5所示。

15
能者818 在职认证  发表于 2022-5-5 01:45:23
RMT的标准结果之一是,GOE展开特征值的最近邻间距分布是著名的Wigner猜想[4–6]:PGOE(d)=πdexp-πd. (18) 我们将最近邻spacingin(βPGOE)的估计密度与归一化参数β进行比较。如图5所示,经验数据符合GOE的分析表达式。我们发现β=0.98±0.05,这与精确值β=1非常接近。我们进一步发现,对于最近邻间距分布,KolmogorovSmirnov统计量为0.066,p值为0.48。在0.05的显著水平下,Kolmogorov-Smirnov的p值根据其分布和GSE进行检验。dnnP(dnn)0 1 2 3 40.2 0.6 1.0图。5:(彩色在线)我们绘制了高斯展开特征值的最近邻间距分布直方图。平滑图是β=0.98±0.05的fβPGoE,PGoE由(18)给出。Kolmogorov-Smrinov统计量和与分析表达式(18)相关的相应p值分别为0.066和0.48。B.次近邻间距分布GOE的第二个测试是将未展开特征值的次近邻间距分布与RMT结果进行比较。对于GOE,展开特征值的下一个到最近邻间距的分布与GSE的最近邻间距分布等价[4–6]。这被称为GOE的GSE测试。GSE最近邻间距的解析表达式为,PGSE(d)=πdexp-9πd. (19) 为了计算次近邻间距的经验值,我们选择RMT范围内的所有特征值(13)。我们进一步将这些特征值λiin除以两个集合,其中有偶数和奇数索引i。现在,这两个集合都是这样的,即原始序列的相邻特征值在同一组中。

16
可人4 在职认证  发表于 2022-5-5 01:45:27
对于每个集合,按照附录A中的程序,我们进行高斯加宽,并计算未展开特征值ξ偶数/奇数。利用这些展开的特征值,我们计算最近邻空间deven/odd=(ξ偶数/oddi+1)-每一组中的ξ偶数/奇数)。现在,我们结合这两个集合中的数据,得到原始特征值序列中次近邻间距的概率密度。密度分布如图6所示,我们用归一化常数β将其表示为(βPGSE)。我们发现β=0.96±0.05,非常接近精确值。KolmogorovSmirnov统计数据为次近邻分布NNNP(dnnn)0.0.5 1.0 1.5 2.0 2.5 3.00.0 0 0.4 0.8 1.2FIG。6:(在线上色)我们绘制高斯展开值的次色调最邻近间距分布直方图。平滑图为fβPGSE,其中β=0.96±0.05,PGSEI由(19)给出。KolmogorovSmrinov统计量和参考分析分布(19)的相应p值分别为0.063和0.55。但p值为0.063,在0.5的显著水平上,p值不能放弃零假设。C.数字差异在本节中,我们将特征值之间的长期相关性与GOE的分析结果进行比较。有一些系统的例子,其中哈密顿不属于GOE,但光谱中的短程关联确实与GOE中的短程关联相似[5]。因此,为了确定Marcenko Pastur分布下的特征值是纯噪声的事实,需要将特征值之间的长期相关性与前述分析结果进行比较。探测特征值之间的长程、两级相关性的一个量是数差。它被定义为在每个折叠特征值ξi[4–6]周围的长度间隔内,展开特征值的数量的方差:∑(`)=NNXi=1(n(ξi,`)- hn(ξi,`)iξ)。

17
能者818 在职认证  发表于 2022-5-5 01:45:31
(20) 这里Nis是展开特征值的个数,n(ξi,`)是区间[ξi]中的特征值个数- `/2,ξi+/2]。此外,hn(ξi,`)iξ是区间[ξi]中特征值个数的平均值- `/这里对展开的特征值ξi进行平均。由于展开的特征值具有均匀分布,hn(ξi,`)iξ=`。如果光谱是平移不变的,那么数字方差可以写成∑(l)=`-2Z`dr(`- r) Y(r),(21),其中Y(r)与两点相关性有关。如果特征值之间没有长程相关性,则得到Y=0,∑(`)=`的泊松谱。然而,GOE的yf表达式采用以下形式:y(r)=y(r)+dy(r)drZ∞rdry(r),(22)其中y(r)=sin(πr)πr。(23)为了从经验上估计数字方差,我们使用附录A中的高斯加宽程序展开了IGENV值。由于数字方差考虑了长期相关性,它受到λ处两个边的影响-和λ+,尤其是当Nis与`相比不是很大时。因此,我们仅使用分布大部分的特征值来估计数方差。GOE的经验估计和数字方差(20)的理论值如图7所示。我们发现这是因为≤ 10,结果与精确结果非常吻合。然而,如插图所示,对于较大的`,数字方差会偏离拓朴森谱。这种行为在特征值数量不是很大的情况下很常见。第IV A、IV B和IV C节的结果表明,波动率相关矩阵特征值的短期和长期相关性与RMT GOE的分析结果非常相似。这些结果有力地支持了相关矩阵的特征值是纯噪声的假设,该矩阵属于MarCenkopasur分布。

18
能者818 在职认证  发表于 2022-5-5 01:45:34
在下一节中,我们将研究挥发性相关矩阵的特征向量的性质,并将其与收益相关矩阵的特征向量进行比较。V.特征向量统计量在本节中,我们研究波动率相关矩阵的特征向量的性质。我们首先回顾了收益相关矩阵(5)特征向量的一些结果。在价格波动的情况下,已经观察到大多数特征值都属于Marcenko Pasturd分布,只有很少的特征值不属于批量分布。特征向量的组成部分是共轭噪声特征值,具有高斯分布[3,8,9]。最大特征值的特征向量共轭为“市场模式”。这种模式相当于一个投资组合,每个资产的权重相等。此外,理论值之外的其他较大特征值均∑(l)2●●●●●●●●●● ●0 2 4 6 8 100.0 1.0 2.0●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0 25 500.0 1.5 3.0图。7:(在线上色)我们将数字方差绘制为间距参数`的函数。黑点是以理论边λ+为界的特征值的估计数方差。光滑线是GOE数方差的理论值。虚线是不相关泊松特征值的数字方差,即∑=`。(插图)黑点是估计数方差,平滑线是放弃数方差的理论值。我们可以看到,对于大的`,估计的数字方差与GOE不同。这通常是在我们处理有限个特征值时观察到的。RMT的边缘,预计将携带真正的相关性。

19
nandehutu2022 在职认证  发表于 2022-5-5 01:45:37
在长达十年的时间里,几乎没有发现最大的特征向量在时间上是最佳的[13,14]。然而,当一个人从最大值移动到一些较小的值时,稳定性的持续时间缩短,最终特征向量变得随机。为了理解这些最大特征向量中包含的信息,其中一种方法是将它们分解为工业组[13,14]。据观察,虽然大多数小特征向量随机将权重分配给所有行业,但最大特征向量由一个或两个行业主导。在V B部分,我们采用同样的方法来研究波动率相关矩阵的特征向量的性质。在第V A节中,我们首先讨论了波动率相关矩阵的特征向量的分布。我们发现,与收益相关矩阵类似,与最大特征值共轭的特征向量是市场模式。然后我们重点讨论了特征向量在RMT范围内与特征值共轭的分布。由于相关矩阵的最大特征值λNof为特征值总数N的数量级,我们发现它显著影响其他特征向量。然而,一旦我们消除了市场模式的影响,我们发现投资分布是高斯分布,与theRMT一致。接下来,我们研究了V B段中与最大特征向量共轭的特征向量的信息含量-4.-2 0 2 40.0 0.1 0.2 0.3 0.4 0.50 10.0 1.5 3.0图。8:(彩色在线)黑色实线是随机矩阵特征向量的高斯分布。虚线和虚线是波动率相关矩阵的几个特征向量的分布,这些特征向量深入到Marcenko Pastur分布中。

20
mingdashike22 在职认证  发表于 2022-5-5 01:45:41
这些特征向量是在从波动性时间序列中去除市场模式的影响后获得的,并且非常适合高斯分布。(插图)我们展示了市场模式的组件分布。虚线是完全随机特征向量的高斯分布。在市场模式下,我们估计不同行业组在这些特征向量中的权重。有趣的是,我们发现,与收益率相关矩阵相比,波动率相关矩阵的最大特征向量很少由几个行业集团主导。A.特征向量的分布为了研究特征向量统计,我们首先对与特征值λi相关的每个特征向量vi进行归一化,例如vTivi=N。我们发现,对于最大特征值λN,相关特征向量的大部分分量都聚集在一个周围。该特征向量是市场模式,其分布如图8的插图所示。现在,我们研究了与Marcenko Pastur分布下的特征值共轭的特征向量。根据RMT,这些特征向量应该具有高斯分布。然而,我们发现,这种分布的峰值比高斯分布更明显。我们在特征向量中也观察到类似的行为,但它没有那么强。由于这两种情况下最大的特征值与批量特征值相比要大得多,市场模式对其他特征向量有显著影响[13,14,27]。因此,消除市场模式的影响并重新检查特征向量分布是合理的。为了消除市场模式的影响,我们对市场模式变量的波动性时间序列进行回归,并使用残差重新计算相关矩阵[13,14]。如果市场模式是特征向量vN,我们可以为市场asM=vTNG=NXi=1vN,iGit编写波动性时间序列。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 07:51