楼主: mingdashike22
2164 165

[量化金融] 清理大型相关矩阵:来自随机矩阵理论的工具 [推广有奖]

51
mingdashike22 在职认证  发表于 2022-6-15 15:53:53
M=A+OhmBOhm*M=A1/2OhmBOhm*A1/2(详见上文第2.3节)。我们将重点讨论自由乘法模型,因为对于自由加法情况,下面的参数可能几乎一字不差地重复(见附录D)。2.4.2. 使用副本的矩阵乘法。我们重新考虑了模型(2.80),并在不损失一般性的情况下假设A是对角的。在这种情况下,我们可以看到PMis仅仅是正交群O(N)上的Haar测度。我们将副本标识(2.92)专门化为M=A1/2OhmBOhm*1/2因此,我们得到gij(z)=limn→0ZNYk=1nYα=1dηαk!ηiηje-zPnα=1PNk=1(ηαk)InXα=1ηαA1/2ηαA1/2*, B(2.93)其中iβ(A,B)=Zexph公司-βNTr AOhmBOhm*身份证件Ohm, (2.94)是所谓的Harish Chandra–Itzykson-Zuber积分【87,88】。该积分的显式结果已知于任意整数维N的厄米矩阵(β=2),但不适用于实正交矩阵。甚至研究(2.94)的极限N→ ∞ 非常重要(见附录A)。然而,在Ais排名有限的情况下,N的主要贡献→ ∞ 已知任何对称群。幸运的是,我们看到我们的案例为n级,结果由附录A中的公式(A.5)得出:InXα=1ηαA1/2ηαA1/2*, B~N→∞exp“NnXα=1WBNNXi=1(ηαi)ai!#,,(2.95)回想一下,我们在计算的整个中间步骤中将n作为一个整数进行处理。withWB(.)=RB(.),(2.96)其中我们假设向量[ηα]nα=1彼此正交,这通常是由n提供的 N、 然后,我们将这个结果插入(2.93)中,并引入一个辅助变量pα=NPNi=1(ηαi),我们使用狄拉克δ函数δ的指数表示来强制执行该变量pα-NNXi=1(ηαi)ai=Z2πexp“iζαpα-NNXi=1(ηαi)ai#dζα,(2.97)对于每个α=1,n、 这允许检索ηα上的高斯积分。

52
大多数88 在职认证  发表于 2022-6-15 15:53:56
重命名ζα=-2iζα/Nyields结果gij(z)∝Z ZnYα=1dpαdζα!δijz-ζaiexp“-NnF(pα,ζα)#(2.98),其中Fis由f(pα,ζα)=nnXα=1“NNXk=1log(z)给出的自由能- ζαak)+ζαpα- WB(pα)#。(2.99)现在,我们可以看到dpαdζα上的积分涉及到Nn/2乘以自由能的指数,这是一阶单位。如果n不为零,可以通过鞍点法估计该积分(当然n最终将被发送到零…)。我们假设鞍点具有复型对称性Satz,即pα=p*ζα=ζ*, α = 1, . . . , n、 这是很自然的,因为Fis在置换群Pn下是不变的。然而,请注意,复制对称ANSATZ可能会导致错误的结果,这种现象被称为复制对称破缺,参见例如[46、86]或[89]及其参考文献中的数学形式。其余的计算依赖于鞍点分析,我们将其细节推迟到下面,最终我们得到了所谓的“全局定律”来解M:zGM(z)i,j~N→∞Z(Z)GA(Z(Z))i,j,Z(Z)…=zSB(zgM(z)- 1) ,(2.100),这通常被称为M和a的预解式之间的从属关系。考虑到上述方程的两边的轨迹,我们注意到(2.100)是公式(2.84)作为矩阵的推广。我们应该强调,公式(2.100)是矩阵GM(z)的逐元素自平均,即Gij(z)=hGij(z)i+O(N-1/2). 作为一个整体的矩阵GM(z)不能被认为是确定性的,例如hGM(z)II通常不同于hGM(z)i。

53
kedemingshi 在职认证  发表于 2022-6-15 15:53:59
当考虑整个矩阵GM(z)时,我们应该写:z hGM(z)i~N→∞Z(Z)GA(Z(Z)),Z(Z)…=zSB(zgM(z)- 1) ,(2.101)注意,平均预解式hGM(z)i在A的特征基中是对角的,正如对称性所期望的那样。术语“全局”假设z的虚部远大于N-1,与在“局部”尺度上对预解式的许多不同研究不同(有关Wigner矩阵这一概念的详细介绍,请参见[90])。对于自由加成模型M=A+OhmBOhm*, 仍然具有a=诊断(a,a,…,aN)(见附录D)。从副本标识(2.92)开始,然后应用(A.5),我们得到以下表达式【37】:Gij(z)∝Z ZnYα=1dpαdζα!δijz-ζ- aiexp公司-NnFa(pα,ζα), (2.102)其中“自由能”fa由fa(p,ζ)给出=NnnXα=1“NXk=1log(z- ζα- ak)-WB(pα)+pαζα#。(2.103)再次调用复制对称ansatz,自由加法模型下预解式的从属关系来自鞍点分析[37]GM(z)i,j~N→∞GA(Za(z))i,j,Za(z)…=z-RB(gM(z)),(2.104),这正是在[91]中以数学形式得到的结果。再次对方程的两侧进行跟踪,可以恢复Stieltjes变换之间的关系(2.67)。2.4.3. 自由乘法:副本鞍点分析。现在,我们从(2.98)导出(2.100)。我们应该知道,它实际上提供了自由乘法公式(2.81)的元素推导。在复型对称ansatz下,自由能为(pα,ζα)≡ F(p,ζ)=NNXk=1log(z- ζak)+ζp- WB(p),需要最大化。我们首先考虑关于p的一阶条件,该条件为ζ*= RB(p*). (2.105)关于ζ的其他导数给出:p*=ζ*NNXk=1akz/ζ*- ak=TAzRB(p*)RB(p*).

54
kedemingshi 在职认证  发表于 2022-6-15 15:54:02
(2.106)因此,将(2.105)和(2.106)插入(2.98),我们得到了大N极限,然后是极限N→ 0byGij(z)ij=δiiz- RB(p*)ci。(2.107)我们可以使用与自由乘法卷积的连接,找到最后一个表达式的真正简化。通过取GM(z)的归一化轨迹,我们可以看到zgm(z)=ZgA(z),其中z≡ Z(Z)=zRB(p*), (2.108),可以重写asTM(z)=TA(z)。让我们定义ω=TM(z)=TA(z)。(2.109)使用公式(2.106),后一个公式表示p*= ω/RB(p*). 现在让我们展示如何在大N极限下从(2.108)中检索自由乘法卷积(2.81)。实际上,让我们重写(2.109)aszTM(z)=ZTA(z)RB(p*), (2.110)可以看出,使用(2.109)可以将最后一个表达式重写为ωT-1M(ω)=ωT-1A(ω)RB(p*). 最后,使用S变换(2.23)的定义,该yieldsSM(ω)=SA(ω)RB(p*). (2.111)使用(2.25),我们还得到了rb(p*)= SB(p*RB(p*)), (2.112)但回顾p*= ω/RB(p*), 我们从(2.105)、(2.109)和(2.112)得出结论,ζ*= RB(p*) = SB(TM(z))。(2.113)回到(2.111),我们看到M的谱密度由Voiclescu的自由乘法公式SM(ω)=SA(ω)SB(ω),(2.114)确定了复制对称ansatz在这种情况下确实有效。最后,将(2.113)插入(2.107),得到结果(2.100)。3、大型经验协方差矩阵的谱3.1。样本协方差矩阵。3.1.1. 搭建舞台。在对RMT和许多不同的分析工具进行了一般性介绍之后,我们现在准备处理本次审查的主要问题,即样本协方差矩阵的统计。作为初步说明,请注意,我们假设每个变量的方差可以独立估计,并且具有很高的精度,因为我们有 1对每一个进行观察。

55
kedemingshi 在职认证  发表于 2022-6-15 15:54:05
因此,所有变量将被视为具有以下单位方差,我们将不再区分进一步的协方差和相关性。如引言所述,相关矩阵的研究在统计学中有着悠久的历史。假设我们考虑(随机)向量y=(y,y,…,yN)。描述这些变量之间潜在交互网络的一种标准方法是通过它们的相关性。因此,目标是尽可能精确地测量真实(或总体)协方差矩阵,定义asCij=Eyiyj公司, i、 j∈ [[1,N]](3.1)其中我们假设{yi}i∈[[1,N]]平均值为零,不丧失一般性(见下文)。从C的定义可以看出,协方差矩阵是对称的。在下文中,我们将确定C asC=NXi=1uiviv的光谱分解*i、 (3.2)具有u>u>…>unN实特征值和v,Vn对应的特征向量。如引言所示,协方差的概念在广泛的应用中至关重要。例如,让我们考虑一个来自金融应用程序的示例。多元化投资组合出现巨额亏损的可能性主要取决于其不同组成部分的相关变动(更多详情请参见第7.1节)。事实上,多元化的概念取决于投资组合中资产之间的相关性。因此,估计这些资产价格变动之间的相关性是风险管理政策的核心。在实践中,主要关注的是真实协方差矩阵C实际上是未知的。要解决这个问题,通常需要大量的独立测量,即“样本”y,yT,构建C的经验估计。因此,我们定义了N×T矩阵∈ RN×T,其元素是变量yi的第T个度量。

56
kedemingshi 在职认证  发表于 2022-6-15 15:54:09
在我们的财务示例中,随机变量Yitwould是时间t时资产i的回报。然后,用大小为t的整个样本数据的平均值来近似等式(3.1),从而得出样本(或经验)协方差矩阵估计值:Eij=t(YY*)ij=TTXτ=1YitYjt。(3.3)在统计文献中,该估计量被称为Pearson估计量,在RMT社区中,所得矩阵有时被称为Wishart集合。虽然WignerEnsemble一直是大量物理学研究的主题[49],但WishartEnsemble的结果主要来自数学与统计[17、55、92]、电信[56]或金融/经济物理学文献[23、28、66],尽管物理文献中也有一些工作[93、94、95、96]——仅举几例。我们称之为“经典”统计极限,即T→ ∞ 在N固定的情况下,大数定律告诉我们,E收敛于真正的协方差C。然而,正如引言中所述,在当前的“大数据”时代,科学家面临着大数据集,样本大小T和变量数量N都非常大,当观测比q=N/T是阶统一时,会出现特定问题。这种设置在文献中被称为高维限制器Kolmogorov机制(或更常见的大数据机制)。这一制度明显不同于传统的大T、固定N情况(即q→ 0),其中多变量统计的经典结果适用。设置q~ O(1)正是RMT工具有助于对经验协方差矩阵(3.3)做出精确陈述的地方。一个典型的问题是研究E的ESD,以量化其与真实协方差矩阵C的偏差。

57
nandehutu2022 在职认证  发表于 2022-6-15 15:54:17
更准确地说,ESD会收敛到显式LSD吗?如果有,我们能得到这个LSD的易处理表达式吗?在样本{yt}Tt=1由均值和协方差为零的多变量高斯分布给出的情况下,自Wishart[8]以来,矩阵的分布是完全已知的,并由上面的等式(2.38)给出,其中M→ E、 在C=T的情况下-1在中,我们检索了上面我们在前一章中充分描述的各向同性Wishart矩阵。现在的目标是为任意真协方差矩阵xc提供E的LSD。更具体地说,我们将研究线性模型,其中数据矩阵Y可以轻松分解=√CX,(3.4),其中X是一个N×T随机矩阵,不相关项满足E[Xit]=0,E[Xit]=T。(3.5)对于多元高斯变量,上述分解总是可能的。否则,上述框架假设我们的相关随机变量yi是不相关随机变量的线性组合。此外,我们还要求随机变量√T xit有一个有界的第4阶矩,换句话说,分布不能是极端尾部的。接下来,我们介绍E的谱分解,E=NXi=1λiu*i、 (3.6)λ>λ>…>λnN特征值和u,解相应的特征向量。下面,让我们列出关于E谱的主要假设,我们将在整个审查过程中保持这些假设:(i)r>0的r+1(连接)组件的ρEconsists支持。我们将r最大的分量称为异常值,最小的分量称为批量。

58
可人4 在职认证  发表于 2022-6-15 15:54:21
体分量的边界点标记为λ-和λ+(带λ-6 λ+).(ii)我们假设离群值彼此分离,并且与整体(非简并)分离。(iii)我们假设体积是规则的,即ρEvanishes的密度在边界点λ处为平方根-, λ+.在本章中,我们将研究该模型特征值的统计信息,下面将讨论特征向量。我们以两条不同的评论结束这篇简短的介绍。第一个是对上述零均值假设的评论,而第二个是关于被审查的随机变量的可能厚尾特性。3.1.2. 零均值假设。在实际数据集中,样本向量yt通常具有非零均值(即使真实的基础分布是零均值)。因此,可以选择以经验平均值正好为零的方式移动样本向量。这导致了对经验相关矩阵的以下定义,通常在文献中找到:Eij=T- 1Text=1Yit公司- 易Yjt公司- Yj公司, Yi=TTXτ=1Yiτ。(3.7)对于T而言,这显然是无偏的→ ∞ 具有固定的。这可以重写为:E=T- 1年(IT- ee公司*) Y*, e、 .=(1, 1, . . . , 1)*/√T∈ 然而,E和E的特征值(和特征向量)的渐近性质是相同的,当q>1时,可能会有一个额外的异常值特征值位于零。理解异常值对谱的渐近行为没有影响的最简单方法是当Y是高斯矩阵时。在这种情况下,我们知道高斯矩阵在旋转下具有统计不变性,因此可以始终在T维空间中旋转向量e,使其变为,例如,(1,0。

59
nandehutu2022 在职认证  发表于 2022-6-15 15:54:24
, 0).然后有:Eij~T- 1TXt=2yityjt,这意味着当N,T→ ∞ 高达一阶的特征值摄动~ T-1.→ 0(有关相关讨论,请参阅第2.3.2节)。对于q<1,这对光谱没有任何影响,因为相应的特征值在整体中被重新吸收。与秩1扰动相关的可能尖峰仅在N>T时存在,并导致上一个方程的额外零特征值。但在q>1的情况下,我们知道有(N- T)额外的零特征值,意味着原点处的额外尖峰是无害的。Y不是旋转不变的情况更难处理,需要更复杂的参数,我们请读者参考[97,第9节]了解更多细节。因此,我们将在下面回顾的关于E特征值统计的所有结果都适用于Eas。从实际角度来看,考虑原始数据或降级数据是不同的。此后,我们将假设样本数据(y,…,yT)的平均值为零,并将在下一节中使用相应的E。3.1.3. 数据项的分布。第二条注释涉及等式(3.5)中给出的矩阵Y的中心分布。例如,众所周知,财务回报率是强非高斯的,具有幂律尾[24],因此,有界矩的充足数量的条件可以被视为限制性的。对于具有极端尾部的条目,可以说什么?这是稳健估计理论的主要目的[98,99],其中RMTregime N 在过去的几年里,人们对T进行了大量的研究,特别是在椭圆分布的情况下[56100101102]。

60
mingdashike22 在职认证  发表于 2022-6-15 15:54:27
特别是,所谓的C的Maronna稳健M估计量是固定点方程M的(唯一)解=TTXt=1U纽约州*tM公司-1年期年初至今*t、 (3.8)其中,U是一个非递增函数。最近【103】表明,矩阵M收敛于式(2.80)中所述形式的阿玛特里克,因此与E不同。然而,除了多元学生分布中的U(x)外,可处理的公式很少~ x个-1[100, 101, 104, 105].在这种情况下,我们从[106]得到,M的LSD收敛(几乎可以肯定)到标准wishart矩阵E的LSD,即N→ ∞. 因此,我们将在下面给出的所有结果都适用于多元Student框架下C的稳健估计(另见[100])。我们将有关其他类别分配的讨论推迟到第9.3.2章。批量统计。3.2.1. Marˇcenko Pastur方程。正如我们在引言中提到的,分析大样本协方差矩阵谱的基本工具是Marˇcenko Pastur方程[17]。实际上,我们已经在第2.2.3节中遇到了该方程的一个特例,其中我们考虑了零假设C=in(各向同性情况)下E的LSD。在这一节中,我们允许总体相关矩阵C是各向异性的,也就是说与恒等矩阵不成比例。正如我们将看到的,最终结果并不像公式(2.41)那么简单,但许多属性都可以从中得到。Marˇcentko Pastur(MP)方程可以追溯到他们的开创性论文【17】,该论文给出了E和C的极限Stieltjes变换之间的精确关系。这一结果是高维统计推断中许多进步的核心(参见第7章中的一些示例或【92】及其引用)。有几种方法可以获得此结果,例如使用。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-24 00:43