楼主: 能者818
986 27

[量化金融] 关于相关随机矩阵特征向量之间的重叠 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
39.6240
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24699 点
帖子
4115
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2024-12-24

楼主
能者818 在职认证  发表于 2022-5-11 13:45:55 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《On the overlaps between eigenvectors of correlated random matrices》
---
作者:
Jo\\\"el Bun, Jean-Philippe Bouchaud, Marc Potters
---
最新提交年份:
2017
---
英文摘要:
  We obtain general, exact formulas for the overlaps between the eigenvectors of large correlated random matrices, with additive or multiplicative noise. These results have potential applications in many different contexts, from quantum thermalisation to high dimensional statistics. We find that the overlaps only depend on measurable quantities, and do not require the knowledge of the underlying \"true\" (noiseless) matrices. We apply our results to the case of empirical correlation matrices, that allow us to estimate reliably the width of the spectrum of the true correlation matrix, even when the latter is very close to the identity. We illustrate our results on the example of stock returns correlations, that clearly reveal a non trivial structure for the bulk eigenvalues. We also apply our results to the problem of matrix denoising in high dimension.
---
中文摘要:
我们得到了加性或乘性噪声下大相关随机矩阵特征向量之间重叠的一般精确公式。这些结果在从量子热化到高维统计的许多不同环境中都有潜在的应用。我们发现重叠只依赖于可测量的量,不需要了解底层的“真”(无噪声)矩阵。我们将我们的结果应用于经验相关矩阵的情况,这使我们能够可靠地估计真实相关矩阵的谱宽,即使后者非常接近恒等式。我们以股票收益率相关性为例说明了我们的结果,这清楚地揭示了大量特征值的非平凡结构。我们还将我们的结果应用于高维矩阵去噪问题。
---
分类信息:

一级分类:Physics        物理学
二级分类:Statistical Mechanics        统计力学
分类描述:Phase transitions, thermodynamics, field theory, non-equilibrium phenomena, renormalization group and scaling, integrable models, turbulence
相变,热力学,场论,非平衡现象,重整化群和标度,可积模型,湍流
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
--> On_the_overlaps_between_eigenvectors_of_correlated_random_matrices.pdf (802.09 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:特征向量 Mathematical Eigenvectors Applications correlations

沙发
何人来此 在职认证  发表于 2022-5-11 13:46:01
关于相关随机矩阵的特征向量之间的重叠Jo¨el Bun,Jean-Philippe Bouchaud,Marc PottersLPTMS,CNRS,巴黎南大学,巴黎萨克莱大学,法国奥赛91405,巴黎大学路23-25号,75 007巴黎我们获得了大型相关随机矩阵特征向量之间重叠的一般精确公式,加性或乘性噪声。这些结果在从量子热化到高维统计的许多不同环境中都有潜在的应用。我们发现,重叠仅取决于可测量的量,不需要了解潜在的“真实”(无噪声)矩阵。我们将我们的结果应用于经验相关矩阵的情况,这使我们能够可靠地估计真实相关矩阵的谱宽,即使后者非常接近恒等式。我们以股票收益率相关性为例说明了我们的结果,这清楚地揭示了大量特征值的非平凡结构。我们还将我们的结果应用于高维矩阵去噪问题。1.引言从量子力学到高维数据分析,大型随机矩阵的特征值和特征向量的结构在许多不同的环境中都是最重要的。相应地,随机矩阵理论(RMT)已经成为一门主要学科,处于理论物理、数学、概率论和应用统计学之间的前沿,拥有一些令人生畏的知识库[1]。RMT最引人注目的应用之一涉及量子混沌和量子输运[2],人们对量子遍历性(“本征态热化”)[3,4]、纠缠和耗散(最近的综述见[5,6])等问题重新产生了兴趣。

藤椅
可人4 在职认证  发表于 2022-5-11 13:46:05
在信号处理方面,RMT在分析高维统计[7–9]、无线通信信道[10,11]等方面至关重要。其他例子包括复杂系统的动力学——从随机生态[12]到眼镜和自旋眼镜[13]。虽然已经对随机矩阵的光谱特性进行了详细的研究,但人们的兴趣最近转移到了其特征向量的统计特性上——最近的论文参见[3,14]和[15–21]。特别是,人们可以问样本矩阵S的特征向量与总体(或纯)矩阵C本身的特征向量如何相似。我们最近在[22]中获得了一系列随机矩阵的纯和无噪声I型变换器之间重叠的明确公式,推广了[15]的样本协方差/相关矩阵的结果,得到的结果为S=√CW√其中W是Wishart矩阵——对于形式为=C+W的矩阵,其中W是对称高斯随机矩阵[18,23,24]。在本论文中,我们想将这些结果推广到这类随机矩阵的两个不同实现的IGenvector之间的重叠,它们通过公共部分C保持相关。例如,假设一个测量同一过程的样本相关矩阵,但在两个不重叠的时间间隔上,以Wishart噪声W和W的两个独立实现为特征。相应的特征向量预计有多接近?我们为高维区域中的这些重叠提供了精确、明确的公式。准确地说,我们对我们的公式给出了透明的解释,并将它们推广到各种情况,尤其是当噪声相关时。

板凳
能者818 在职认证  发表于 2022-5-11 13:46:09
也许令人惊讶的是,这些重叠只能从S的经验谱来评估,也就是说,没有关于纯矩阵C本身的任何先验知识。这导致我们提出了一种基于这些重叠的统计测试,它允许我们确定在上述多重和加法情况下,随机矩阵S和▄S的两种实现是否确实对应于非常相同的基本“真实”矩阵C。我们还将回顾旋转不变估计(RIE)[25]的理论,该理论最近受到了很多关注(请参见[15,26-28])。一、理论结果a。反转公式。在下文中,我们考虑N×N对称随机矩阵,并用λ>λ>表示λn和的特征值由u,u,解开对应的特征向量。类似地,我们用∧>λ>表示λλn特征值S和,解开相关特征向量。请注意,为了方便起见,我们有时会用相应的特征值对特征向量进行索引。我们强调,我们允许描述S和S随机性的参数不同。我们在这项研究中关注的中心对象是渐近(N→ ∞) 按比例,均方重叠Φ(λ,λ)…=氖huλ,~uλi, (1) 在极限N内保持O(1)→ ∞. 在上述等式中,期望E可以解释为随机性的不同实现上的平均值,或者,对于固定随机性,可以解释为宽度η=dλ的特征值的小“切片”上的平均值 N-1,使得结果在大N极限下成为自平均。我们将用复函数ψN(z,~z)…=E“NTrh(z- (S)-1(~z-~S)-1 i#,(2)其中z,~z∈ C.对于大型随机矩阵,我们期望特征值[λi]i∈[[1,N]]和[~λi]i∈[[1,N]]坚持他们的分类位置,即根据光谱密度的分位数平滑分配。

报纸
何人来此 在职认证  发表于 2022-5-11 13:46:14
不同的是,样本特征值在大极限下变得具有确定性。因此,在取连续极限后,我们得到ψN(z,~z)~ ψ(z,~z),其中极限值由ψ(z,~z)给出=ZZ%(λ)z- λ∧%(∧λ)~z-λΦ(λ,~λλ)dλdλ,(3)用S和S的谱密度的%和%计算ψ(x)- iη,y±iη)=ZZ(x- λ+iη)(x- λ) +η(y)-~λ  iη)(y)-§λ)+η%(λ)§%(§λ)Φ(λ,§λ)dλdλψ(x)- iη,y+iη)- ψ(x)- iη,y- iη)=ZZη%(λ)(x)- λ) +ηη∧%(∧λ)(y)-∧λ)+ηΦ(λ,∧λ)dλd∧。(4) 我们现在可以调用Sokhotski-Plemelj恒等式来获得反演公式Φ(λ,~λ)=Re[ψ(z,~z)- ψ(z,~z)]2π%(λ)~%(~λ),(5)z=λ- iη,z及其复共轭和ψ≡limη↓0+ψ. 最后一个公式告诉我们,在高维区域,我们可以通过双变量函数ψ(z,~z)来研究均方重叠(1),这更容易使用RMT的工具来处理(见下文)。B.乘性噪声。研究函数ψ的渐近行为需要控制S和@S的预解项。最近的研究表明,人们可以通过确定性等价量来近似这些(随机)预解式[22,29,30]。我们首先从介绍中介绍的Wishart乘性噪声开始。更准确地说,让我们:=√CW√C和S:=√C~W√C其中,W和Ware是两个独立的Wishart矩阵,可能有两个不同的观测比qN/T和<<q=N/<<T。通过独立性,我们得到ψN(z,~z)=NNXk,lEP(z)- (S)-1公斤EP(~z)-~S)-1公斤, (6) 式中,EP[·](resp.EP[·])表示与toS(resp.~S)相关的概率测度P(resp.~P)上的期望值。

地板
大多数88 在职认证  发表于 2022-5-11 13:46:17
然后,我们使用S的预解式的确定性估计,它产生N→ ∞ [22,29,30]:EP(z)- (S)-1公斤~ ζ(z)zζ(z)- C-1kg+O(N)-1/2),(7)其中我们定义了ζ(z)=1.- q+qzg(z),(8)和g(z)是S的斯蒂尔杰斯变换,定义为N的极限值-1Tr[(z)- (S)-1]. 通过将ζ、q和g替换为ζ、q和g,估计值(7)也适用于S。注意,我们可以通过取(7)中的标准化轨迹来推导与g(z)相关的固定点方程,从而得出N→ ∞g(z)~ ζ(z)gC(zζ(z)),(9),其中gC是与纯矩阵C相关联的斯蒂尔杰斯变换。同样地,通过将ζ与∧ζ相加,从(9)中获得@g的值。通过将等式(8)插入等式(6),我们得到ψN(z,~z)~NTr[ζ(z)(zζ(z)- C)-1~ζ(~z)(~z~ζ(~z)- C)-1] ,然后,使用恒等式(zζ(z)- C)-1(~z~ζ(~z)- C)-1=~z~ζ(~z)- zζ(z)[(zζ(z)- C)-1.- (~z~ζ(~z)- C)-1] ,(10)我们得到ψN(z,~z)~ζ(z)~ζ(~z)~z ~ζ(~z)- zζ(z)NTr[(zζ(z)-C)-1.-(~z~ζ(~z)-C)-1].从最后一个方程,我们推导出ψN(z,~z)~~z~ζ(~z)- zζ(z)×ζ(~z)NTrhζ(z)(zζ(z)- C)-1i-ζ(z)NTrhζ(~z)(~ζ(~z)- C)-1i!。从(9)中可以注意到,后一个方程中的两个规范化跟踪项在大N极限中由g(z)和@g(@z)精确给出。因此,我们得出结论,在乘法Wishart摄动的情况下,(2)的渐近值读取ψ(z,~z)~ζ(~z)g(z)- ζ(z)~g(~z)~zζ(~z)- zζ(z),(11),适用于任何q=O(1)和q=O(1)。等式(11)中引人注目的观察是,结果并不明确地依赖于我们希望估计的总体矩阵C。这一特征非常重要,因为它表明我们只能根据可观测变量来描述均方重叠(1)。现在我们已经确定了渐近值ψ(z,~z),现在让我们计算主要的感兴趣量,即等式(1)。为此,可以方便地使用复函数m(z):=1/(zζ(z))。

7
能者818 在职认证  发表于 2022-5-11 13:46:20
实际上,通过用函数m表示(11),我们以ψ(z,~z)=qqzz结束(~qz)- q~z)~mm- ~m+(q- ~q)~mm- ~m+m+~mq~z-1.- qqzz.定义m(λ)=limη↓0m(λ)- iη)≡ mR(λ)+imI(λ),经过一些基本计算(详见附录A)得到以下一般结果:Φq,~q(λ,~λ)=2(~qλ)- q)λ)α(λ,)λ)+(q)- q) β(λ,~λ)λλγ(λ,~λ),(12)其中我们定义了α(λ,~λ)=mR(λ)|m(|λ)|- ~mR(~λ)|m(λ)|(13)β(λ,~λ)…=|~m(~λ)|- |m(λ)|γ(λ,|λ)=(mR(λ)- mR(λ))+(mI(λ)+mI(λ))×(mR(λ)- ~mR(~λ))+(mI(λ)- ~mI(~λ)).最终结果(12)在(q,λ)与(~q,~λ)的交换下是不变的,并且不明确地依赖于C,这是预期的。我们将在下一节中看到,这是建立可观察稳定性测试的一个关键特性。很容易证明,这个公式再现了给定样本特征向量与其在极限q中的真值之间的均方重叠→ 0(参见[15,22])。为了证实我们的说法,让我们考虑一下q→ 0,其中∧→ u其中u表示相应的总体特征值[31]。在这个特定的框架中,我们有mR=1/u和mI=0。因此,我们从(12)中推断Φq,~q→0(λ,u)=q|λ| 1- um(λ)|,(14),这正是[15]的结果。接下来,我们来看一个例子,我们将数据集分成两个大小相同的窗口(q=~q),当人们希望测量与相同特征值相关的特征向量的稳定性时,这是相关的。对于q=~q,IGENVALUESλ和▄λ现在根据相同的密度函数分布,因此▄m(▄λ)=m(▄λ)。此外,我们从(13)中推断出(12)中β(λ,~λ)的贡献消失。自重叠极限∧→ λ需要小心处理,因为公式(12)在nq=~q时似乎不明确。

8
何人来此 在职认证  发表于 2022-5-11 13:46:24
然而,如果我们写ε>0的∧λ=λ+ε,那么就有α(λ,λ+ε)=ε|m|λmR- 先生λ| m|+ O(ε),γ(λ,λ+ε)=4εmI(λ)|λm(λ)|+O(ε)。因此,我们将这两个表达式插入到(12)中,然后设置ε=0,从而得出结论:自重叠由Φ(λ,λ)=q2λ| m(λ)给出|λmR(λ)/|m(λ)|mI(λ)|λm(λ)|。(15) 我们现在解释如何将这些结果推广到更一般的乘性噪声。更具体地说,让我们考虑S形式的矩阵=√科博*√C、 其中O是根据Haar测度在正交群O(N)中选择的随机矩阵,B是独立于C和O的agiven随机矩阵(类似模型见E.g.[20,22,32])。上述调查的框架与海外建筑运营管理局*是Wishart矩阵。利用[22]的结果,我们发现对于这个一般模型,(11)仍然成立,ζ(z)=SB(zg(z)- 1) 其中SBI是B矩阵的所谓Voiculescu’sS变换[33]。如果B=W,那么sb(ω)=1/(1+qω)。然而,由于S变换的分析结构取决于B.C.加性噪声的选择,因此在这个阶段,在这种一般情况下,似乎很难获得均方波RLAP(1)的显式公式。对于加性噪声,我们用于多重复制噪声模型的所有参数几乎可以一字不差地重复。在加性实对称高斯噪声的情况下,在文献中称为高斯北正交系综(GOE),我们有两个独立的GOE矩阵,分别是方差σ和σ。预解式(z)的每一次尝试-(S)-1在高维区域[18,22,30]:EP中,也可以用确定性值来近似(z)- (S)-1公斤~ζa(z)- C-1kg,(16)其中我们定义了[42]ζa(z)…=Z- σg(z)。(17) 同样,通过将ζa、g和σ替换为ζa、g和σ,渐近极限(16)适用于/S。

9
nandehutu2022 在职认证  发表于 2022-5-11 13:46:28
通过进行与上述相同的计算,我们得到了ψN的极限值:ψa(z,~z)=g(z)-~g(~z)~ζa(~z)-ζa(z)。(18) 至于公式(11),公式(18)仅依赖于先验可观测量,因为它不明确涉及未知总体矩阵C。因此,我们将使用反演公式(5)获得(1)的可观测表达式。现在我们可以开始计算加性高斯模型中的均方重叠(1)。从(18)中,我们发现limη→0ψa(λ)- iη,~λ+iη)- ψa(λ)- iη,λ- iη)=Gζa-ζa+ ζa~g-~g+ g|ζa-~g~ζaζa- ζaζa- ζa在这里我们使用了符号g≡ limη↓0+g.定义ζa=limη↓0+ζa(λ-iη)≡ ζaR+iζa并执行与上述类似的代数运算(详情见附录B),我们最终得到Φaσ,@σ(λ,@λ)=2(@σλ)- σλ(ζaR)-ζaR)+(σ- λσ)βa(λ,~λ)γa(λ,~λ)(19),其中γa(λ,~λ)由与γ(λ,~λ)inEq相同的表达式给出。(13) 随着替换的发生→ ζaRand mI→ ζa和βa(λ,~λ)=ζaR(λ)- ζaI(λ)ζaR(λ)+ζaI(λ)-ζaR(λ)-ξζaI(λ)ζaR(λ)-ξζaI(λ). (20) 我们注意到,当我们假设两个高斯噪声具有相同的方差时,β-aagainvarianies项的贡献。与乘法情况一样,自重叠Φa(λ,λ)是通过将(19)以ε的幂展开,得到的。通过取ε=0:Φa(λ,λ)=σ,最终得出λζaR(λ)(ζaI(λ))λζa(λ). (21)与乘法情况类似,加法模型可以推广到S=C+OBO*B和O的定义相同。在这种情况下,上述结果(18)成立,但现在ξ(z)=z- RB(g(z)),其中RB(z)是B矩阵[33]的R变换,当B=W是高斯随机矩阵时,它仅等于RB(z)=σz,如上所述。结果(19)的另一个有趣且重要的扩展是当噪声W,~W相关时——而上述计算指的是独立的噪声。

10
大多数88 在职认证  发表于 2022-5-11 13:46:31
在加法的情况下,诀窍是认识到一个人(在法律上)写W=√ρW+√1.- ρWand~W=√ρW+√1.- ρW,其中W现在是独立的,如上所述。由于我们的公式不依赖于公共矩阵C,因此可以用C代替+√ρW.那么,等式(21)基本成立,σ替换为σ- σσρ与σ和σ——噪声矩阵的宽度和W(详见附录C)。同样地,用σ代替∑- σσρ. 注意,在噪声参数相同的情况下,σ仅乘以1-ρ. 图1显示了ρ和σ=@σ不同值的Φa(λ,λ)的相应形状。我们还在插图中提供了固定ρ=0.54,σ=1的合成数据的比较。实验过程中,噪声和增益的实现超过了200次,协议非常好。在乘法模型中考虑相关噪声至关重要,因为它描述了在重叠周期上测量的相关矩阵的情况,例如=√C[W+W]√C和S=√ChW+~Wi√C(见下文第三节B)。事实证明,这起案件更为微妙,是不断调查的主题。图1:主图:固定λ的自重叠Φa(λ,λλ)的评估≈ 对于N=500、σ=1和不同的ρ值,0.95是λ的函数。总体矩阵C由参数T=2N的(白色)Wishart矩阵给出。插图:我们比较了理论预测Φa(λ,λ)≈ 0.95),对于固定ρ=0.54的合成数据。经验平均值(蓝点)来自100个独立的S.D.卷积公式实现。在研究这些公式的一些具体应用之前,让我们以对上述形式主义的有趣解释来结束这一理论部分。我们首先介绍纯矩阵C的特征向量集vu,用特征值u标记。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-3 16:01