楼主: nandehutu2022
1096 42

[量化金融] 一种基于内存的方法,用于选择 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-14 11:50:51
我们绘制右特征向量wof E(对应于市场模式)的条目,并绘制图2,其中蓝线给出了相应2D向量原点的长度。我们从图2中看到,ware的条目均为正值,这证实了第一个特征向量确实影响所有股票。4、长记忆我们现在考虑时间序列的“长记忆”特征,专门讨论金融背景下的对数波动性。任何时间序列x(t)的自相关函数(ACF)κ(L)定义为sκ(L)=corr(x(t+L),x(t))=h[x(t+L)x(t)]iσ,(10),其中h。。。i表示x(t)上的时间期望,调整为零均值。L是滞后,σ是过程x(t)的方差。如果κ(L)的衰减速度大于或等于L的指数衰减速度,则时间序列被称为内存不足[27]。然而,在许多现实世界的系统中,从水文学的洪水到温度测量【27】,人们发现κ(L)的衰减速度比指数衰减速度慢得多,从而产生了一种称为长记忆的重要影响【27】。这意味着时间t的过程仍然受到遥远过去发生的事情的严重影响。特别是对于金融数据a(其中x(t)=ln r(t)|),一个公认的风格事实(称为波动率聚类)是,波动率的大变化通常伴随着波动率的其他大变化,或者波动性保留了内容8(a)E(b)g图1:(a)根据经验数据集构建的E特征值分布直方图(见附录a),与红色的最佳Marˇcenko Pasturd分布相比较。λ轴被前斜杠分割,仅显示λ+=2.80以下的整体特征值。插图显示了半对数尺度下λ>λ+的22个孤立特征值。

12
大多数88 在职认证  发表于 2022-6-14 11:50:55
Marˇcentko Pastur分布的参数sq=0。38±0.02,σ=1.03±0.01。(b) 相同的直方图,但适用于相关矩阵G(见第5.1节),其中市场模式已被去趋势化。这里λ+=2.77,q=0.41±0.02,σ=1.01±0.01,λ++以上有35个特征值。图2:该图中的每个点i都有坐标(wi1,wi2),其中wi1是顶部特征向量w的i-thentry,wi2是附录A中数据集的相关矩阵E(定义在等式(2))的第二个特征向量wo的第i个条目。对应的2D坐标向量从原点的长度由每条蓝线给出。该图显示,WI1的所有值实际上都是正值。目录9先前的价值[52]。κ(L)也被经验发现遵循幂律衰减κ(L)~ L-βvol,(11)其中βvol描述了记忆效应的强度–较低的值表示对过去值的记忆保留时间较长。然而,如【15】所示,为了更好地区分短内存和长内存,可以方便地考虑非参数集成代理η,定义为η=zlcutel=1κ(L)dL,(12),其中Lcutis是5%水平的标准Bartlett切割【40】。κ(L)t hanβvol的噪声修饰对代理η的影响较小[15],η的值越大,记忆效应的程度越大。这种可观察性将构成我们方法的基本依据。方法在本节中,我们详细描述了我们的程序。5.1. 对市场模式进行趋势分析我们方法的第一步是消除市场模式的影响,即我们在第3.2节中暗示的影响数据的全球因素。为此,我们将公式(8)中的标准化对数波动率ωi(t)=ln | ri(t)|采用因子模型(使用资本资产定价模型,CAPM[53,54]),市场模型i(t)=NXi=1wi1ln | ri(t)|(13)作为因子。

13
大多数88 在职认证  发表于 2022-6-14 11:50:58
该数量——本质上是ln | ri(t)|的加权平均数,权重为w,即顶部特征向量的分量s——代表整个市场对所有股票的影响,即所有股票同时采取的共同方向。因此,我们定义ωi(t)=βi0I(t)+αi0+ci(t)。(14) 这里,βi0是股票i对市场模式i(t)变化的响应,αi0是相对于市场的过度波动,ci(t)是剩余对数波动。ωi(t)与i(t)的标准线性回归揭示了市场作为一个整体无法解释的剩余可用性ci(t)。所有股票的standardisedci(t)材料ix标记为X(市场)。我们称G为X(市场)的相关矩阵,其中entriesGij=TTXt=1ci(t)cj(t)。(15) 内容10根据定义,矩阵G将通过Q消除市场模式的影响。(14). 这种清理程序也使关联结构更加稳定[55],因此,从现在起,我们将使用矩阵G。正如我们对矩阵E所做的那样,我们再次拟合了Marˇcentko Pastur(MP)分布——这次是G的经验特征值分布。这一点即使在存在自相关的情况下也是正确的,因为在大部分情况下,内存量相当低。我们可以通过计算特征值低于λ+的中间Lcutover主成分(适用于已确定的MP分布,即2)从经验上看到这一点。这些值非常接近1,这是我们将为白噪声找到的值。在存在弱自相关的情况下,[56]表明,散货中特征值的分布与MP分布略有不同。我们在图1(b)中清楚地看到了这种失真,图1(b)在形状上与[56]中计算和绘制的pdf有一些相似之处(参见图1)。然而,MP分布是一个简单且非常好的近似值,尤其是对于图1(b)中的边缘点。

14
能者818 在职认证  发表于 2022-6-14 11:51:01
我们预计,特征值的数量应该增加,因为市场模式的取消使得真实的相关性结构更加明显,低内部相关性集群更加明显[55]。图1(b)中详细说明的结果证实了这一点,在图1(b)中,我们看到体积以外的特征值数量(如图1(b)中的插图所示)从22减少到35。注意,我们还从图1中看到,最佳fit q和σforE与G非常相似,这与[57]的理论结果相匹配。有了这一发现,我们可以安全地忽略MP sea中响应特征值的所有主要成分。对于附录A中的经验数据,这一观察已经从1202到35得出了合格成分的最大值(我们称之为mmax)。我们还记得,Ghave的特征向量根据工业分类基准(ICB)超部门进行了经济解释,更多详情,请参见附录B.5.2。主成分回归考虑式(15)中的矩阵G,如果市场模式的影响已经消除,我们现在必须评估每个股票i的对数波动率与每个主成分的对数波动率之间的关系。我们通过将等式(14)中的ci(t)与主成分的对数波动率的平均行为进行比较来获得这一结果。平均行为Ip(t)定义为asIp(t)=NXi=1wipci(t),p=1。。。,mmax,(16),即第p个主成分的加权平均对数波动率,其中Wip是G的第p个特征向量的第i个条目。因此,等式(16)是theresidue ci(t)在mmax主成分上的投影。主成分s是相关矩阵G的正交基,并表示确定ci中的函数的重要特征。

15
大多数88 在职认证  发表于 2022-6-14 11:51:04
因此,定义一个因子模型是有意义的,我们称之为“基于mmax的PCA因子模型”,其中解释变量为mmax主要成分[1,58]ci(t)=mmaxXp=1βipIp(t)+i(t),(17),其中i(t)是具有零均值和有限方差的白噪声项,而ci(t)是等式(14)中定义的剩余波动率。这里,βipi是指ci(t)对Ip(t)变化的响应性,表明股票i的对数波动率是高于(βIp>1)还是低于Ip(t)(βIp<1)。现在,我们可以通过将之前获得的输入ci(t)与所有Ip进行回归来确定βIp。这将把由主成分解释的信号与系统中存在的剩余噪声分离开来。将使用Lassomed方法进行回归(详见附录C)。5.3. 评估记忆贡献我们方法的下一步是估计m=1,2,…,的记忆贡献。。。,MMAX组件。固定m,我们计算每个股票的数量d(m)i(t)=ci(t)-mXp=1βipIp(t),i=1。。。,N(18) 这里,βi是通过式(17)中的回归得到的系数。d(m)i(t)是去除前m组分后的残留物。使用d(m)i(t),我们可以首先计算它们的t时间自相关κ(m)i(L)inEq。(10) 对于L=1和L=T之间的滞后L的不同值-1、我们一般发现,κ(m)i(L)遵循幂律衰减,是L的函数——见下例。3描述了m=1时的κ(m)i(L),11为ALJ区域控股公司(ALJJ),该股票包含在附录a中的经验数据集中。随着更多成分被移除(即m增加),ALJJ方程(11)中定义并绘制在图3中的指数βvol从0.277增加到0.322。

16
能者818 在职认证  发表于 2022-6-14 11:51:08
这是人们所期望的结果,因为随着移除更多组件,占用的内存数量将减少。通过对κ(m)i(L)进行数值积分,我们获得了一组集成内存代理η(m)i(见等式(12)),每个资产i和移除组件的每个数量m各一个。一般来说,η(m)是m的非递增函数,因为进一步移除子序列组件必然会降低系统中存在的剩余内存水平。我们现在定义ζ(m)=中值η(m)iη(0)i!,(19) 式中,η(m)是积分代理,而η(0)只是等式(14)中定义的剩余波动率ci(t)的积分代理。因此,ζ(m)表示“平均”含量120 1 2 3 4 5 6-4-3.5-3-2.5-2-1.5-1经验拟合(a)κ(1)(L)0 0.5 1 1 1.5 2 2.5 3-3.2-3-2.8-2.6-2.4-2.2-2-1.8-1.6经验拟合(b)κ(11)(L)图3:蓝色κ(m)(L)对数标度图,如式(10)所示,其中x(t)=d(m i(t),对于股票ALJ Regional Holdings(ALJJ)。这里,m=1在左边,m=11在右边。用红色表示最佳拟合线(使用泰尔森估值器[59]),左图和右图的幂律衰减指数βvolas分别为0.277和0.322。所有库存的行为,即每个主成分对内存的影响程度。这也是m的一个非递增函数,通过定义所有m的ζ(m)<1。在图4(c)中,我们分别在附录a和第6.1节中以对数-对数比例绘制了经验数据集和综合数据集的ζ(m)。我们在θ的某个值处观察到了一个显著的变化,我们的解释如下:在θ的右侧,当越来越多的成分被逐渐包含时,系统中未解释的内存量变化非常缓慢。

17
何人来此 在职认证  发表于 2022-6-14 11:51:11
这清楚地表明我们已达到“最佳停车”点m除此之外,包含更多组件不会增加更多信息。超过θ,ζ(m)的行为为幂律ζ(m)~ m级-γm≥ θ,(20),其中γ是expo-nent。使用附录D中描述的θ的拟合过程产生最佳整数估值器^θ。因为^θ的值表示形式<^θ- ζ(m)比幂律下降得更快,我们可以安全地设置m=^θ - 1.(21)5.4. 程序摘要选择最佳数量m的程序要保留的主要组成部分,包含长内存内容的标准化数据矩阵X 130 0.5 1 1.5 2 2.5 3 3.5-2.6-2.4-2.2-2-1.8-1.6-1.4-1.2中等最佳拟合(a)均匀0.5 1 1.5 2 2.5 3.5-3.5-3-2.5-2-1.5-1中等最佳拟合(b)非均匀0.5 1 1 1.5 2 2 2 3 3.5 4-1.7-1.6-1.5-1.4-1.3-1.2-1.1-1-0.9-0.8中等最佳拟合(c)经验图4:(左上)定义的均相合成系统ln(ζ(m))与ln(m)的曲线图在第6.1节中。蓝线是穿过所有资产的ζ(m)值,灰红线表示^θ=20,即凹度变化的点。(右上)相同的plo t,但适用于第6.1节所述的异构模拟系统,其中^θ=13。(Bo t tom)相同的图,但对于附录A中所述的经验数据集,得出^θ=16。^θ的这些值意味着数字m要保留的主要组件的数量应为m= 分别为19、12、15。影响(步骤的合理性可在每个步骤后的文胸标签部分中找到):(i)从X到表X(市场)消除任何全局影响,表X(市场)的序列为等式(14)中定义的残留物(t)[第5.1节]。(ii)计算X(市场)的相关矩阵G,并确定其特征值的经验概率密度。

18
能者818 在职认证  发表于 2022-6-14 11:51:17
在等式(9)中找到特征值mmaxexceedingλ+、Marˇcenko Pastur分布的上边缘的数量[第3.2节]。(iii)根据公式(17)建立基于mmax的PCA因子模型,使用lasso回归(见附录C)确定参数集βip。这是通过将残留物ci(t)与主成分Ip(t)含量的平均行为进行回归,14p=1。。。,mmax[第5.2节]。(iv)使用这些βip,确定每个m=1。。。,Mmax和stock i——方程式(18)[第5.3节]中给出的残留物d(m)i(t)。(v) 根据d(m)i(t),计算L不同值的时间自相关nsκ(m)i(L),并通过积分确定代理η(m)i。根据公式(19)构造ζ(m)[第5.3节]。(vi)使用附录D中的拟合程序来确定θ,θ的最佳估计值–ζ(m)凹度变化的点–定义在公式(20)中。最后,要保留的最佳主成分数为m=^θ - 1[第5.3节]。6、将我们的方法应用于本节中的合成和经验数据,我们在合成生成的数据和附录A.6.1中定义的经验数据集上测试我们的方法。合成系统设置具有长记忆的随机过程的一个范例是分馏高斯噪声(FGN)。具有赫斯特指数H的FGN是过程Y(t),其自相关函数由κf GN(L)给出=|L- 1 | 2H- 2 | L | 2H+| L+1 | 2H~ H(2H- 1) L2H公司-2.(22)等式(22)确实表明,FGN具有长记忆,因为其自相关函数遵循第4节所述的幂律衰减。特别是,对于1/2<H<1(H=1/2对应于标准白噪声),我们有一个正相关的过程,这是财务数据所共有的特征【28】。增加H将增强FGN中存在的记忆强度,因为在这种情况下,κF GN(L)的衰减更慢。

19
何人来此 在职认证  发表于 2022-6-14 11:51:20
我们将使用【60】中详述的方法生成FGN的实现。在我们的综合环境中,我们考虑由N只股票组成的一个活跃市场,并在时间窗口t内模拟每只股票的低波动率ωi(t)。为此,我们利用了广泛认可的金融经验数据常常被组织成集群的事实【61–64】。因此,我们规定股票被组织成不相交的集群,每个集群包含NK股票。接下来,我们生成影响所有股票的有效市场模式I(t)[41、50、51]。这只是一个具有赫斯特指数H的FGN过程,我们将在模拟中将其设置为0.9。我们还将I(t)的方差乘以1。因此,我们的模拟对数波动率过程将读取ωi(t)=βi(t)+βk(i)Ik(i)(t)+i(t),(23),其中k(i)表示资产i所属集群的指数,而Ik(t)是Hurst指数为HK且固定方差为1的areFGN过程。i是具有零均值和方差φ的白噪声项。内容15我们在模拟中使用的典型值是N=1200,T=4000和K=30。我们模拟了两个集群内部安排不同的市场:第一个集群是同质的,每个集群的大小正好是40,第二个是异构的,这意味着每个集群有不同数量的股票。后一种情况尤其重要,因为金融数据以及许多其他系统中存在的集群规模是异构的【61,62】。为了生成异构系统,我们使用了[65]中描述的过程,该过程产生了幂律分布集群大小,这是真实世界数据的一个关键属性[66]。我们用于生成N=1200的聚类大小的该方法的具体实现是,每个聚类中的平均库存数量为40,标准偏差为26.2。

20
nandehutu2022 在职认证  发表于 2022-6-14 11:51:23
我们还设置了β=1.3,而βkare值介于0.14和1之间,hk是介于0.7和0.9之间的等距序列。这种选择确保了βK值较高的集群也具有较高的ERHK值,从而与[67]的经验结果相联系,即波动性较高的股票具有较长的记忆。最后,φ固定为1,与时间序列I(t)和Ik(t)的方差相同。注意,我们还使用附录E中的1 lag(AR(1))[40]的自回归过程来模拟相同的系统,其中我们说明我们的方法也可以应用于这种情况,但精确度较低。这支持了这样一种推理,即图4(c)中缓慢减小到^θ右侧更适用于长内存进程而不是短内存进程。将对数波动率ωi(t)安排在矩形数据矩阵X中,然后我们可以将X输入我们的算法程序,并检查有多少重要成分sm它检索。我们的合成模型的一个理想特征是,很容易先验地估计E=(1/T)X+X(或其去趋势对应物G)的特征值中有多少包含可以从纯无ise中分离出来的信息。之所以会出现这种情况,是因为每个聚类对应一个主成分,因此超出整体的IgenValue数只有K。这使得后验比较更加有趣。6.2. 结果对于合成和实证数据,我们模拟了我们合成市场的100个独立样本,在检查统计数据是否足以证明我们结果的稳定性后,我们按照第5.3节末尾规定的程序选择. 首先,我们检查了从模拟X获得的相关矩阵的IGENVALUE分布。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 19:37