楼主: nandehutu2022
767 21

[量化金融] 用随机矩阵确定预测模型中的因素数 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-23 20:55:38
RRR的非线性推广为人工神经网络提供了一个灵活的模型【19】。然而,模型确定的主要和最困难的部分之一是评估参数t的未知值,这被称为多元回归的有效维度。截至2019年5月3日7/17,Wmin(t)的减少量从t=tto t=t增加,其中t<t,由Wmin(t)给出- Wmin(t)=tXj=t+1λj.(12)此关系仅通过n=Γ∑YX∑的特征值{λj}依赖于Γ-1XX∑XYΓ(13)然而,在进行统计分析之前,可能不知道的值,因此,这些约束的数量和性质。因子数随机矩阵理论(RMT)是处理特征值有限分布的重要框架。从历史上看,RMT的发展是为了解决核物理的复杂问题,最近是为了解决量子混沌问题。在过去几十年中,RMT的开创性应用出现在介观物理学、生物微阵列、无线通信和经济物理学的背景下【21–25】。被引用作品的一个共同点是以下结果,在这里用高维统计语言重新表述。设X为矩阵p×n,其中元素Xi,jare i.i.d.分布为n(0,1)的随机变量。那么,当p,n→ ∞, 因此NP→ c∈ (0, ∞), Wishart矩阵的谱密度W=n-xxconverge(a.s.)至Marcenko Pasturlaw【4】ρ(x)=p(xmax- x) (十)- xmin)2πcx,(14),其中xmaxmin=(1±√c) 。(15) 在经济物理学界,Marchenko Pastur分布被称为Wishart矩阵的普遍结果。

12
nandehutu2022 在职认证  发表于 2022-6-23 20:55:41
如果金融变量之间没有相关性,则其相关矩阵的特征值应在该RMT预测之间有界[24,25]。在统计学领域,考虑零假设检验至关重要。最后一个结果中出现的Wishart矩阵可以表示为wp(n,I),其中I是n的总体分布的协方差矩阵-1XX。在我们的例子中,有必要将恒等式协方差矩阵H:∑=I的假设与另一种情况HA:∑6=I进行比较,其中∑具有一些更一般的结构。在此方法下,可以计算置信区间,以接受或拒绝一般维度范围和n的经验数据集Wishart矩阵的通用结果。量化置信水平的方法基于最大样本特征值λP{λ>t:H的零假设分布的近似值~ Wp(n,I)}。(16) 随机矩阵理论的以下结果导致了所需的近似分布[26]。假设~ Wp(n,I),p/n→ γ ∈(0, ∞), 并将^λ表示为特征值方程Au=^λu中的最大特征值。然后,最大特征值的分布接近Tracy–Widom FβlawsP{n^λ≤ unp+σnps | H}→ Fβ(s)(17)2019年5月3日8/17,其中unp=(√n个+√p) ,σnp=unp√n个+√p1/3. 存在优雅的公式来解决Tracy Widom分布函数sF(s)=sF(s)exp-Z∞sq(x)dxF(s)=exp-Z∞s(x- s) q(x)dx,(18) 这是关于非线性二阶微分方程q的解q=sq+2q,q(s)~ Ai(s)ass→ ∞, 也被称为经典的潘列夫II型方程。函数族Fβ在数值上是q的函数。尽管需要一定的努力来求解Fβ,但从应用数据分析的角度来看,它们是特殊函数,如正态曲线【27】。让我们举例说明Tracy Widom测试的相关性。

13
大多数88 在职认证  发表于 2022-6-23 20:55:44
假设在p=10变量高斯分布n(0,∑)的n=10个观测样本中,出现最大样本特征值λ=4.25。在这些维度下,马琴科-帕斯特分布的支持度被限定在区间[0,4](见公式(15)),然后,统计方面的问题是,观察到的最大特征值4.25与h一致:∑=I,当n=p=10?二阶Tracy–Widom近似值[28]产生了6%的几率,即使不存在结构,也有可能看到比4.25更极端的值,即∑=i。与传统的5%基准相比,这并没有足够的证据来拒绝零假设H[29]。Tracy-Widom测试与确定ON/pof测试的数量相关。这些问题可以在最大根分布下推广。它描述了明显不同问题的零假设,包括多重响应线性回归、多元方差分析、典型相关、协方差矩阵相等等[30]。[31]的下一个定义正式指出了最大的根分布。让A~ Wp(m,I)独立于B~ Wp(n,I),其中m≥ p、 (A+B)的最大特征值θ-1B被称为最大根统计量,其分布被称为θ(p,m,n)。它的性质是θ(p,m,n)d=θ(n,m+n- p、 p),(19)当n<p时有用。最大根统计和Tracy-Widom分布之间存在有趣的联系。

14
kedemingshi 在职认证  发表于 2022-6-23 20:55:47
Johnstone[32]的工作表明,在适当的居中和缩放条件下,θ的logit变换W近似为tracy–Widom分布W(p,m,n)- u(p,m,n)σ(p,m,n)d→ F、 (20)其中w(p,m,n)=logitθ(p,m,n)=logθ(p,m,n)1- θ(p,m,n)(21)是θ的logit变换,定心和缩放参数由u(p,m,n)=2 log tan定义φ + γ, σ(p,m,n)=(m+n- 1) sin(φ+γ)sinφsinγ,(22)2019年5月3日9/17为角度参数γ,φ定义为γ=最小值(p,n)- 1/2米+n- 1,sinφ=最大值(p,n)- 1/2米+n- 1.(23)在这一点上,我们有兴趣指出一个程序,通过最大根统计来确定RRR模型中的参数,这协调了这两个框架。这一普遍现象是基于典型相关分析(CCA)。它涉及将变量集合划分为两个集合。比方说,一个带有qvariables的X集和一个带有p变量的X集。目的是找到最大相关组合η=ax和φ=by。尽管CCA具有与PCA相似的最大性质,但典型相关的目标是两组变量之间的关系,而不是一组变量之间的相互关系。假设(X,Y)是关于q+p变量的观测值的数据矩阵,使得每个样本独立于其他样本,并且具有种群分布np+q(u,∑)。假设样本协方差矩阵S分区=SXXSXYSYXSYY. (24)i=1,…,的样本平方正则关联(ri),k=min(p,q)作为MS=S的特征值-1YYSYXS-1XXSXY,而人口对应物由M∑=的特征值给出-1YY∑YX∑-1XX∑XY【31】。注意,M∑的非零特征值与等式中N的非零特征值相同。

15
大多数88 在职认证  发表于 2022-6-23 20:55:50
(13) 对于Γ=∑-1YY,这正是RRR一般模型中的CCA情况。我们现在感兴趣的是描述通过Tracy-Widom检验检验两组变量H:∑=0的零相关性假设的过程。首先,让我们指出关于partitionedWishart矩阵的联合独立性的下一个结果。让M~ Wp(n,∑),并将矩阵M划分为子矩阵Mof维a×a和Mof维b×b,其中a+b=p,n>a。定义矩阵M=M的乘积- 毫米-1米。然后【31】(a)Mhas为Wb(n- a、 ∑)分布,且独立于(M,M),(b)如果∑=0,则n- M=毫米-1具有WB(a,∑)分布,以及mm-1M、M和Mare共同独立。另一方面,联合交集检验(UIT)的假设技术使用基于最大特征值rof MS的统计量。但Msc可以写成[M+(M- M) ]-1(米- M) ,其中M=nSY Y,M=n(SYY- SYXS系统-1xxxsxy)和m- M满足最大根统计量的独立条件。因此,在h:∑=0的情况下,Rha是θ(p,n- q-, q) 分布,并且可以应用Tracy–Widom近似。前面的推导展示了通过RMT框架统计确定aRRR模型排名的过程。具体来说,它描述了一般RRR模型的H∑特殊情况CCA。在下文中,描述了使用预测变量和响应加密货币变量的数据集,寻找CCA中有意义成分或因素数量的应用方法。在实际数据中使用这些技术的第一步是基于数值求解方程式(18)中涉及的方程组,考虑Painlev方程,边界条件为→ ∞, q(t)渐近于Airy泛函i(t)。

16
kedemingshi 在职认证  发表于 2022-6-23 20:55:53
我们求解这些非线性微分方程时,绝对误差为2019年5月3日10/17的1倍-15遵循【27】中给出的方法。表3分别显示了Tracy-Widom分布平面的一个子样本。第三列显示了与相关的X、Y值相对应的累积密度值(cdv),从1中减去该值可确定Tracy Widom统计检验中的显著性水平。表3:。Tracy Widom值X y cdv。。。。。。。。。1.995 0.017669 0.9895102.000 0.017535 0.9895982.005 0.017402 0.9896852.010 0.017270 0.9897712.015 0.017139 0.9898572.020 0.017009 0.9899422.025 0.016880 0.9900262.030 0.016751 0.9901102.035 0.016623 0.9901932.040 0.016497 0.990276.........平面上x、y值的子样本,以及特蕾西-维多姆分布的相应cdv。接下来,我们将CCA应用于加密货币变量集。在此分析中,分别将其视为X、Y集。当使用最大根分布θ(p,n-q-, q) 参数SP=49,q=51,N=4532槽式方程。(20-23)在显著性水平为0.01时,共发现6个因子。图4显示了解释的百分比方差与因子数量的函数关系,在CCA情况下,预测值和响应分量的增加是对称的,但t=1提供预测元素。在那里,垂直灰色虚线表示切割处的重要组件数量。插入图显示的是相同的,但为半对数比例。曲线图未显示曲线的突然变化。因此,如果我们使用弯头标准,就不可能确定模型中要考虑的组件的适当数量。

17
能者818 在职认证  发表于 2022-6-23 20:55:56
此外,与交叉验证方法相比,tracy-Widom检验的计算时间可以忽略不计,因为我们只需要计算一次显著性水平表。此外,我们绘制了图5和图6中前三个因素的响应和预测权重。可以看出,第一个因素的所有系数在响应和预测情况下都具有正权重。它类似于PCA下金融骰子的行为,其中与最大特征值相关的特征向量(或因子)只有正系数,被称为集体模式。受此逻辑启发,由于第一对响应预测因子与最大奇异值相关,我们可以将它们分别标记为集体响应和集体预测模式。第二对因素,在相同的数字中显示为绿色,具有不同的行为。一般来说,它们在零左右波动,但在特定货币中有一个很强的峰值。在响应情况下,该峰值为正,对应于向量链硬币,而在预测情况下,峰值为负,对应于系链硬币。根据这些结果,我们可以大胆地将2019年5月3日称为11/17图4。解释了CCA中的差异。组件元素的。插入图显示相同,但为半对数比例。影响具体反应和具体预测模式的因素,但有必要从动态分析中获得更多证据来保持这一观察结果。最后,第三对反应预测因子没有显示出特定的模式,也不可能试图给它们一个意义。以下第四到第六个因素表现出类似的行为,这也是我们在图5和图6中省略它们的原因。图5:。响应权重。

18
kedemingshi 在职认证  发表于 2022-6-23 20:55:58
与响应变量相关的特征向量分量。在科学界,一个与计量经济学问题不熟悉的因素数量的确定有关的常见问题是,为什么不作为最可能的因素或成分使用,因为这可以提高预测的精度。因此,值得在这个方向上发表评论。在计量经济学中,确定模型中成分的最小数量是最基本的,因为它想赋予每个成分解释意义,以便解释它们背后的经济理论。因此,本研究关注的是正确确定成分的数量。2019年5月3日12/17图6。预测权重。与预测变量相关的特征向量分量。结论一般而言,随机矩阵似乎是处理金融和经济问题中的因素终止的一种很有前景的工具。然而,许多理论是围绕随机矩阵发展起来的,而实践者仍然没有应用这些理论。为了填补这一空白,我们描述了RRR模型和Tracy-Widom检验之间的联系,以确定在一般RRR模型的CCA减少情况下有意义的因素或成分的数量。结果表明,加密货币变量的前两对响应预测集具有可解释的意义。建议的程序的主要优点是避免了视觉检查的主观因素,就像肘部标准一样,并且避免了交叉验证方法的计算成本。除此之外,特蕾西·维多姆的分布测试还有一个概念上的优势,即它与更一般的数学框架的关系,涉及基础数学和理论物理的许多分支。这项工作的另一个贡献是基于信息理论的变量选择方法。

19
nandehutu2022 在职认证  发表于 2022-6-23 20:56:02
我们使用TE来衡量可用性测试之间的信息流。在某些情况下,我们可以覆盖很多场景,包括变量之间可能存在的非线性依赖关系。当TE估计为图时,我们提出了一个与节点的入度和出度相关的启发式准则。同样,测量TE的符号方法具有将p值关联起来的优势,这在计量经济学界一直是需要的,并使我们的结果在统计意义上更加稳健。有趣的未来工作是考虑∑6=I的情况,以建模异方差和序列相关性。这种结构可以使用自由矩阵建模,以获得作为优化问题的因素。此外,它还可以通过数值模拟来解决,其中特蕾西-维多姆(Tracy-Widom)联合分布的特征值起着至关重要的作用。这些问题与计量经济学文献中广为人知的动态因子模型有关,具有解释性更强的优势,并与向量自回归(VAR)和向量误差修正模型(VECM)等结构性预测模型相联系。2019年5月3日13/17确认确认CONACYT通过FOSEC SEP-INVESTIGACI'ON B'ASICA252996提供的资金。参考文献1。中本S.比特币:一个点对点电子现金系统。比特币2009年。可从https://bitcoin.org/bitcoin.pdf引用日期:2019年4月26日。加密货币市场资本化。CoinMarketCap。可获得的fromhttps://coinmarketcap.com引用日期:2019年4月26日。Stosic D,Stosic D,Ludermir TB,Stosic T.加密货币价格变化的集体行为。Physica A.2018年10月1日;507:499-509.4. 弗吉尼亚州马尔琴科,阿拉巴马州Pastur。一些随机矩阵集的特征值分布。某人。数学1967;114(4):507-36.5. Beguˇsi\'c S、Kostanjˇcar Z、Stanley HE、Podobnik B。

20
nandehutu2022 在职认证  发表于 2022-6-23 20:56:05
比特币市场中极值价格波动的标度特性。Physica A.2018年11月15日;510:400-6.6. Dickey DA,Fuller WA。单位根自回归时间序列估计量的分布。J、 上午。《统计协会》1979年6月1日;74(366a):427-31.7。Schreiber T.测量信息传输。物理。修订版。利特。2000年7月10日;85(2):461.8. 信息理论与统计学。纽约:约翰·威利父子出版社;1959.9. 格兰杰CW。通过计量经济学模型和互谱方法研究因果关系。计量经济学。1969年8月1日:424-38.10。Bossomaier T、Barnett L、Harr\'e M、Lizier JT。移情简介:复杂系统中的信息流。德国查姆:SpringerInternational Publishing;2016.11. Barnett L、Barrett AB、Seth AK。对于高斯变量,格兰杰因果关系和转移熵是等价的。物理。修订版。利特。2009年12月4日;103(23):238701.12. Hlav\'aˇckov\'a-Schindler K.格兰杰因果关系和转移熵的等价性:一个推广。应用程序。数学Sci。2011; 5(73):3637–48.13. Barnett L,Bossomaier T.将熵作为对数似然比进行传递。物理。修订版。利特。2012年9月28日;109(13):138105.14.时间序列非线性测量。2002年4月11日;88(17):174102.15. Staniek M,Lehnertz K。符号传递熵。物理。修订版。利特。2008年4月14日;100(15):158101.16.香农·CE。通信钟系统的数学理论。《技术杂志》,1948年7月;27(3):379-423.17.Lizier JT。JIDT:研究复杂系统动力学的信息论工具包。正面机器人人工智能。2014年12月2日;1:11.2019年5月3日1718年14月。伊森曼AJ。多元线性模型的降秩回归。J、 Multivar。肛门。1975年6月1日;5(2):248-64.19. 伊森曼AJ。现代多元统计技术:回归、分类和流形学习第1版。纽约:Springer-Verlag;2008.20. 古尔·T、穆勒·格罗林A、韦登·穆勒·哈。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-9 05:43