楼主: nandehutu2022
1396 43

[量化金融] 因子的随机选择在一个特定的时间内保持了相关结构 [推广有奖]

31
可人4 在职认证  发表于 2022-5-11 05:55:04
PCA再现了时间序列的各个数据点。这一发现通常归因于Hecht Nielsen(1994)。准确地说,但时间序列的cro-ss相关性的再现并不是很好,主要是因为低估了波动性。换句话说,RFM保留了数据的结构,但不一定是单个时间序列的细节,而PCA表示保留了细节,但不一定是相关结构。值得指出的是,主成分分析法适用于保留时间序列的协方差,而不是相关性。RFM绝不适用于数据,因此相关性的保存非常重要。之前的文献比较了随机投影法和主成分分析法的性能,发现结果与我们的结果相似。宾厄姆和曼尼拉(2001)发现,在图像数据压缩和文本聚类方面,随机投影方法的表现明显优于PCA。Goal等人(2005年)发现,尽管PCA在维数较少的情况下更准确,但随机投影与PCA相比更具优势。Tang等人(2005)发现,在文本聚类中,基于PCA的方法在维数较小的情况下提供了更好的准确性,而在维数较高的情况下,随机投影方法占主导地位。Deegalla和B ostrom(2006)发现,在五个图像数据集和五个微阵列数据集中,主成分分析以少量维度为主,但当数据维度增加时,其性能会恶化(交叉发生在15–150维度,具体取决于数据集),而随机投影在高维度上占主导地位。我们的发现与之前的研究结果一致。RFMs领域是由大量长时间序列组成的巨大数据集的领域。

32
kedemingshi 在职认证  发表于 2022-5-11 05:55:07
RFM回答了这个问题:一般线性因子模型需要多少因子才能以特定的精度描述数据。感谢作者感谢Petri Niininen博士收集初始数据集。J.Lukkarinen的研究得到了芬兰科学院分析与动力学研究执行中心(项目271983)和一个科学院项目(项目258 302)的支持。这项工作还得益于法国国家研究机构(ANR)的EDNHS ANR-14-CE25-0011项目的支持。JL感谢Antti Knowles就随机矩阵模型进行的讨论和参考。参考文献Achlioptas,D.(2003年)。数据库frie ndly随机预测:约翰逊-林登斯特劳斯与二进制硬币。计算机与系统科学杂志66(4),671-687。亚历山大·C.(2001)。市场模型:财务数据分析指南。乔恩·威利父子公司。亚历山大,C.(2009年)。市场风险分析,风险价值模型,第4卷。约翰·威利父子公司。阿马多,J.J.(2007)。用于有损图像压缩的随机投影和正交性。图像和视觉计算25(5),754–766。贝尔曼,R.(1957)。动态规划。林塞顿大学出版社。比林斯利,P.(1995年)。支持婴儿和测量,长官。概率和数理统计。纽约:威利。宾厄姆、E.和H.曼尼拉(2001年)。降维中的随机投影:应用于图像和文本数据。第七届ACM SIGKDD知识发现和数据挖掘国际会议记录,第245-250页。ACM。布鲁姆,A.(2006)。随机投影、边距、核和特征选择。计算机科学课堂讲稿3940,52。Boivin,J.和S.Ng(2006年)。因子分析的数据越多越好吗?《经济计量学杂志》132(1),169-194。Bun,J.,J.-P.Bouchaud和M.Potters(2017年)。

33
大多数88 在职认证  发表于 2022-5-11 05:55:10
清理大型相关矩阵:来自随机矩阵理论的工具。物理报告666,1-109。J.Y.坎贝尔、A.W.-C.罗和A.C.麦金莱(1997年)。金融市场的计量经济学。普林斯顿大学校长s.达斯古塔、s.和A.古普塔(20 03)。约翰逊和林登斯特劳斯定理的初等证明。随机结构与算法22(1),60–65。Deegalla,S.和H.Bostrom(2006年)。通过主成分分析和最近邻分类的随机投影来减少高维数据。机器学习与应用,2006年。ICMLA\'06。第五届国际反腐败大会,第245-250页。IEEE。埃卡特,C。和G·杨(1936)。一个矩阵被另一个低秩矩阵逼近。心理测量学1(3),211-218。Edelman,A.和N.R.Rao(2005年)。随机矩阵理论。美国学报14,233–297。法玛、E.F.和K.R.弗伦奇(1993年)。股票和债券收益中的常见风险因素。《金融经济学杂志》33(1),3-56。Goal,N.,G.Bebis和A.Fian(2005年)。人脸识别是随机m投影的一种尝试。《美国间谍诉讼录》第5779卷,第426-437页。Golub、G.H.和C.F.Van Loan(2012年)。矩阵计算,第3卷。JHU出版社。格林诺德,R.C.和R.N.卡恩(2000)。积极的投资组合管理。纽约州麦克劳希尔。古普塔、A.K.和D.K.纳加尔(1999年)。《矩阵变量分布》,第104卷。华润出版社。赫克特·尼尔森,R.(1994)。上下文向量:根据原始数据组织的通用近似意义表示。计算智能:模仿生活,43-56。Indyk,P.和R.Motwani(1998年)。近似最近的ne ighbors:towar ds移除维度曲线。第三十届ACM计算理论年会论文集,第604-613页。ACM。詹森,S.(1997)。高斯希尔伯特空间,第129卷。剑桥大学出版社。Johnson,R.A.,D.W.Wichern等人(2014年)。

34
kedemingshi 在职认证  发表于 2022-5-11 05:55:14
应用多元统计分析,第4卷。新泽西普伦蒂斯庄园。约翰逊、W.B.和J.林登斯特劳斯(1984年)。Lipschitz映射在Hilbertz空间中的推广。当代m无神论26(189-206),1。卡斯基,S.(19-98)。随机映射降维:聚类的快速相似性计算。《神经网络学报》,1998年。IEEE世界计算智能大会。1998年IEEE国际联合会议,第1卷,第413-418页。IEEE。科霍宁,T.,S.卡斯基,K.拉格斯,J.萨洛贾维,J.霍卡拉,V.帕泰罗和A.萨雷拉(2000年)。大量文档收藏的自组织。IEEE神经网络学报11(3),574–585。Laloux,L.,P.Cizeau,J.-P.B ouchaud和M.Potters(1999年)。财务相关矩阵的噪声修饰。《物理检查信函》83(7),1467。Ledoit,O.和M.Wolf(2004年)。亲爱的,我缩小了样本协方差矩阵。《投资组合管理杂志》30(4),110-119。Ledoit,O.和M.Wolf(2012年)。大维协方差矩阵的非线性收缩估计。安。统计学家。30, 1024–1060.Liu,K.,H.Kargupta和J.Ryan(2006)。基于随机投影的乘法数据扰动,用于隐私保护分布式数据挖掘。IEEE知识与数据工程学报18(1),92–106。卢卡里宁,J。和M.Marcozzi(2016年)。Wick多项式和累积量的时间演化。《数学物理杂志》57(8),083301。Lukkarinen,J.,M.Marcozzi和A.Nota(2016)。非独立格场的联合累积量之和。arXiv预印本arXiv:1601.08163。马勒弗涅,Y.和D.索内特(2004)。在大样本相关矩阵中,表观随机矩阵理论噪声和因子共存的集体起源。物理A:统计力学及其应用331(3),660–668。Marchenko,V.A.和L.A.Pastur(1967年)。

35
大多数88 在职认证  发表于 2022-5-11 05:55:18
一些随机矩阵集的特征值分布。Matematicheskii Sbornik 114(4),507–53 6。马科维茨,H.(1952)。投资组合选择。《金融杂志》7(1),7-91。马头石,J.(2008)。关于约翰逊-林登斯特劳斯引理的变种。随机结构与算法33(2),142-156。麦克尼尔,A.J.,R.弗雷和P.Embrechts(2015)。定量风险管理:概念、技术和工具。普林斯顿大学出版社。Peccati,G.和M.Taqqu(2011年)。维纳混沌:矩、累积量和图:计算机实现综述,第1卷。斯普林格科学与商业媒体。Plerou,V.,P.Gopikrishnan,B.Rosenow,L.A.N.Amaral和H.E.Stanley(1999年)。金融时间序列中互相关的普遍性和非普遍性。物理评论83(7),1471。Reris,R.和J.P.Brooks(2005年)。主成分分析和优化:教程。在弗吉尼亚州里士满第14届形式计算学会会议上,1月11日至13日,第212页至225页。罗斯·S·A.(1976)。资本资产定价的套利理论。《经济理论杂志》13(3),341-360。夏普,W.F.(1964年)。资本资产价格:风险条件下的市场均衡理论。《金融杂志》19(3),425–442。Stock,J.H.和M.W.Watson(2002年)。使用大量预测因子的主成分进行预测。《美国统计协会杂志》97(460),1167-1179。唐,B.,M.谢泼德,E.米利奥斯和M.I.海伍德(20 05)。比较并结合降维技术,实现高效的文本聚类。《暹罗国际数据挖掘特征选择工作坊》第17-26页。特雷西,C.A.和H.维多姆(1994年)。水平间距分布和艾里核。数学物理通讯159(1),151-174。特蕾西,C.A.和H.维多姆(1996年)。关于正交矩阵系综和辛矩阵系综。

36
kedemingshi 在职认证  发表于 2022-5-11 05:55:21
数学物理通讯177(3),727–754。Vempala,S.S.(2005年)。《随机投影法》,第65卷。美国数学协会。本文证明了随机因子模型中投影算子的均值和方差的以下结果。定理A.1假设k≥ 1,d≥ 2和随机矩阵B的矩阵元素∈Rk×i.i.d.和N(0,1)-分布。对于某些给定值大于0的情况,定义一个新的随机矩阵P∈Rd×dby P:=aBTB。然后对于每一个非随机向量u,v∈ r以下所有结果都成立:1。E[(pu)m]=akumfor all m,and[upu]=akuu.2。Var((pu)m)=ak嗯| u|对于所有的m.3。E[cpu,pv]=ak(d+k)Cu,v+akduuuv.4。如果uu=uv=0且d≥ 4,然后是Var(CP u,Pv)≤ 该定理的主要应用是上述结果的以下结果:推论A.2假设k≥ 1,d≥ 4和随机矩阵B的矩阵元素∈Rk×i.i.d.和N(0,1)-分布。设置a=[k(k+d)]-1/2定义P=aBTB。然后对于每一个b>0和非随机向量u,v∈ Rd,当uu=uv=0时,以下所有结果均成立:1。E[(pu)m]=[k/(k+d)]1/2μm,对于所有m和[upu]=0.2。Var((P u)m)=嗯+(d)- 1) σu/(d+k)适用于所有m.3。E[cpu,pv]=Cu,v.4。P[| CP u,P v- Cu,v|≥ b]≤kbσuσv.推论的证明:通过增加假设uu=uv=0,样本方差的定义产生恒等式|u |=(d- 1) σuand | v |=(d)- 1) σv.因此,项目1、2和3是使用a=1/(k(d+k))的直接推论。另一方面,如果我们用s表示CP u的标准偏差,PvBy s,那么通过切比雪夫不等式,我们得到了P[| CP u,Pv- Cu,v|≥ [政务司司长]≤ C-2对于任何c>0的情况。因此,用c:=b/S表示P[| Cpu,Pv- Cu,v|≥ b]≤ 某人-2.

37
可人4 在职认证  发表于 2022-5-11 05:55:25
因此,定理的第4项暗示了推论的last项中的界。定理证明:假设k,d,B,a,P,u,v如定理中所示,并定义Z:=pu,Z′=pv和C:=cpu,pv.Zm,Z′m,m=1,2,d、 C都是实值r和O变量。以下结果也可以通过依赖于Wick乘积规则(即Isserlis定理)的简单但相当长的直接估计来证明,该定理适用于当前的高斯随机变量Bjm。通过使用Wick多项式展开,可以更好地控制相关的组合数学。对于高斯随机变量的当前情况,Wick多项式简化为Hermite多项式;附录A(Lukkarinen and Marcozzi,2016)简要总结了一般Wick多项式的定义和主要性质,我们参考了J anson(1997);Peccati和Taqqu(2011年);Lukkarinen等人(2016),以获取更详细的论述。我们依赖于随机变量多项式的任意中心期望的Wick多项式展开式:对于r和om变量x,x,…,的任何乘积,当Corres-ponding索引集I={1,2,…,n}时,一个hasnYi=1xi-EnYi=1xi=十、6=EIE易∈I\\Exi:易∈Exi:。(17) 对于任何m=1,2,d、 定义y ie ldZm=(P u)m=adXn=1kXj=1BjmBjnun。(18) 由于Bjmare i.i.d.以标准化高斯为中心,这意味着[Zm]=adXn=1kXj=1{n=m}un=akum,(19)其中{n=m}代表一个指示函数,当n=m时,其值为1,否则为0。因此[upu]=dPdn=1E[Zm]=akuuAsE[Bjm]=0,将变量Zm居中产生以下简单的Wick多项式表达式:Zm-E[Zm]=adXn=1unkXj=1:BjmBjn:。

38
mingdashike22 在职认证  发表于 2022-5-11 05:55:28
(20) Wick多项式的有用性在于其乘积满足与累积量展开式相同的简单乘积的性质,另外还有一条规则,即在其中一个Wick多项式内具有指数簇的任何分区都将从展开式中丢失。例如,对于任何随机变量x,x,x,x-不需要是独立的,也不需要是高斯单相[:xx::xx:]=κ[x,x,x,x]+κ[x,x]κ[x,x]+κ[x,x]κ[x,x],(21),其中κ表示累积量。这里,例如,κ[x,x]=Cov(x,x)。将其应用于b变量yieldsE[:BjmBjn::Bj′m′Bj′n′:={j′=j,m′=m}{j′=j,n′=n}+{j′=j,n′=m}{j′=j,n=m′},(22)因为对于高斯随机变量,第四累积量等于零。因此,通过(20)和(22),我们得到了cov(Zm,Z′m′)=E[(Zm-E[Zm](Z′m′)-E[Z′m′])]=adXn′,n=1unvn′kXj′,j=1E[:BjmBjn::Bj′m′Bj′:=ak{m′=m}dXn=1unvn+kum′vm!=ak{m′=m}u·v+um′vm, (23)因此,特别是Var(Zm)=E[(Zm-E[Zm])]=ak|u |+um. (24)因此,我们现在已经证明了定理的前两项。在剩下的两项中,组合数学逐渐变得更重。让我们从标量乘积pu·pv=Z·Z′=dXm=1ZmZ′m=dXm=1ZmZ′m+akdXm=1(umz′m+vmzm)+akdXm=1umvm(25)开始,其中zm=zm-E[Zm]=Zm- akum,z′m=z′m-E[Z′m]=Z′m- akvm表示中心变量。对m′=m取一个期望值并使用(23),从而使[pu·pv]=dXm=1ak(u·v+umvm)+aku·v=ak(d+1+k)u·v。(26)C的定义明确地解读为Yc=CP u,Pv=d- 1dXm=1(pu)m(pv)m-dd- 1upuupv=d- 1Z·Z′-dd- 1uZuZ′。(27)为了计算它的期望值,我们仍然需要评估[uZuZ′]=Cov[uZ,uZ′]+E[uZ]E[uZ′]=ddXm′,m=1Cov[Zm,Z′m′]+akuuuv=akddXm′,m=1{m′=m}u·v+um′vm+ akuuuv=akdu·v+ak(k+1)uuuv。

39
nandehutu2022 在职认证  发表于 2022-5-11 05:55:31
(28)因此,E[C]=akd- 1(d+k)u·v-dd- 1ak(k+1)uuuv=ak(d+k)Cu,v+akduuuv,(29)在上一步中,我们使用了标识u·v=(d- 1) Cu,v+duuuv。对于最终结果,让我们另外假设uu=uv=0。为了避免使用itera多项式,让我们从C=d开始-1Z·Z′-dd-1uZuZ′并将这两项分别以芯形式表示。也就是说,现在uZuZ′=addXn′,n=1vn′undXm′,m=1kXj′,j=1BjmBjnBj′m′Bj′n′,(30),其中四个B因子的乘积可以使用Wick多项式展开(17)。由于只有偶数个B:s的产品的期望值可以是非z-e-ro,因此我们得到了bjmbjnbj′m′Bj′n′-[BjmBjn[BjmBjn[BjmBjn[Bjmbbjn[BjmBjn[BjmBjn[BjmBjn[BjmBjn[Bj北京[Bjbj北京[Bjbjbj北京[Bjbjmbjn[Bjbjbjbjbjn[Bjbjbjbjbj[Bjbjbjn[Bjbjbjbjbj[BJn[Bjbjbjbjbjn[北京[北京[北京[Bjbjbjbjbjbjbjbjbjbjbjbjbjbjbjbj[北京[北京[北京[北京[北京[bjbjbjbjbjbjbjbjbjbjbjbjbjbjbjbjbjbjbjbj[北京[北京[北京[北京[北京[北京[北京[北京[北京BjmBjn:+{j′=j}{m=m′}:BjnBjn′:+{m=n′}:BjnBjm′:+{m′=n}:BjmBjn′:+{n=n′}:BjmBjm′:(31)因此,uZuZ′-E[uZuZ′)=addXn′,n=1vn′undXm′,m=1kXj′,j=1:BjmBjnBj′m′Bj′+addXn′,n=1vn′unkXj=1:BjnBjn′:+addXn′,n=1vn′unkXj=1:BjnBjn′+add- 1dCu,vdXm′,m=1kXj=1:BjmBjm′,(32)其中我们应用了假设uu=0=uv- 1Z·Z′=ad- 1dXn′,n=1vn′undXm=1kXj′,j=1BjmBjnBj′mBj′,n′,(33)和(31)BjmBjnBj′mBj′n′-E[BjmBjnBj′mBj′n′]=:BjmBjnBj′mBj′n′:+{m=n}:Bj′mBj′n′:+{m=n′}:BjmBjn:+{j′=j}:BjnBjn′:+{m=n′}:BjnBjm:+{m=n}:BjmBjn′:+{n=n′}:BjmBjm:, (34)我们得到了Wick多项式展开式- 1Z·Z′-ED- 1Z·Z′=公元- 1dXn′,n=1vn′undXm=1kXj′,j=1:BjmBjnBj′mBj′n′+ad- 1(2k+d+2)dXn′,n=1vn′unkXj=1:BjnBjn′+aCu,vdXm=1kXj=1:BjmBjm:。(35)将上述结果结合在一起,最终得出中心C,C的Wick多项式展开式-E[C]=ad- 1dXn′,n=1vn′undXm=1kXj′,j=1:BjmBjnBj′mBj′n′:-广告(d)- 1) dXn′,n=1vn′undXm′,m=1kXj′,j=1:BjmBjnBj′m′Bj′n′+ad- 1(2k+d+1)dXn′,n=1vn′unkXj=1:BjnBjn′+aCu,vdXm=1kXj=1:BjmBjm:-adCu,vdXm′,m=1kXj=1:BjmBjm′:。

40
kedemingshi 在职认证  发表于 2022-5-11 05:55:35
(36)我们用这个公式计算Var(C)=E[(C-E[C])]。在包含不同degr ee Wick多项式的乘积的扩展公式中,由于六个B因子使用了三对,其中一对连接了四次多项式中的两个元素。因此,例如,E[:BjmBjnBj′m′Bj′n′::BjmBjm′:=0。结果表明,二阶项的乘积产生了主要贡献。在完成因子广告后-2(d)- 1)-2.它的意思很明确d(2k+d+1)dXn′,n=1vn′unkXj=1:BjnBjn′:+du·vdXm=1kXj=1:BjmBjm:-u·vdXm′,m=1kXj=1:BjmBjm′:= d(2k+d+1)dXn′,n,n′,n=1vn′unkn′unkXj,j=1E[:BjnBjn′:BjnBjn′::+d(u·v)dXm,m=1kXj,j=1E[:BjmBjm::BjmBjm:+(u·v)dXm′,m,m′,m=1kXj,j=1kXj,j[:bjmbjjm′:::::+2d 2k+d+1)u·vdn n′,n=1dmbjnxj:]- 2d(2k+d+1)u·vdXn′,n=1vn′unkXj,j=1dXm。m′=1E[:BjnBjn′:BjmBjm′:]- 2d(u·v)kXj,j=1dXm,m.m′=1E[:BjmBjm::BjmBjm′:,(37)简化了tod(2k+d+1)k(|u | v |+(u·v))+2d(u·v)dk+2(u·v)kd+4dk(2k+d+1)(u·v)- 0- 4dk(u·v)=d(2k+d+1)k | u | | v |+[d(2k+d+1)k+2dk+2dk+4dk(2k+d)](u·v)。(38)在剩余的乘积中,允许的配对与排列一一对应,其中le ft乘积中的每个因子与右乘积中处于其“排列”位置的因子配对。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 18:26