楼主: 可人4
1496 44

[量化金融] 噪声拟合、估计误差和夏普信息准则 [推广有奖]

21
能者818 在职认证  发表于 2022-5-10 20:33:20
原因是,noisein估计的平均收益率非常严重,在任何实际应用中,只有相对较少的资产或参数和相对较长的估计周期才能进行优化。然而,如果施加了平均回报(例如,将所有资产设置为最小方差投资组合中的相等值,或设置为具有严格置信边界的分析师预测值),则协方差矩阵中的估计误差占主导地位,且手头的设置不直接适用。然而,让我们注意一下,如果我们对真协方差∑有一个噪声估计∑,并且我们知道真实的返回u,我们可以为Markowitz-portfoliowMV=-1u = Σ-1.Σ^Σ-1u|{z}=^u=∑-1^u. (4) 因此,权重就好像我们知道真正的协方差,但会将其应用于收益的噪声估计值。从这个角度来看,协方差矩阵中的噪声和平均收益中的噪声非常相似。3.主要定理我们现在准备好阐述我们的主要定理。定理3.1(夏普比的估计误差和噪声拟合组合)。让k≥ 1.假设^u=u+ν,其中~ N(0,T∑)是正态分布,∑有满秩,则它保持[N+E+U]=EkT^ρ.特别是,我们有E[^τ]=E^ρ -kT^ρ. (5) 证据。见附录。定理3.1表明SRIC=^ρ-kT^ρ是预期样本外夏普比E[^τ]的无偏估计量。我们将其命名为SRIC,用于Sharpe比率信息标准,原因在第4节中已明确。偏差校正可分为噪声和估计误差。定理3.2。同意定理3.1的假设。假设τ*> 0,则(5)中的偏差方向可分为噪声系数和估计误差,如下所示≈ SRIC=样本中的^ρ|{z}-k2T^ρ|{z}估计噪声系数-k2T^ρ|{z}估计误差,其中分裂是o(T)阶渐近有效的-1).证据在附录中。我们现在量化^τ周围的不确定性。定理3.3。

22
mingdashike22 在职认证  发表于 2022-5-10 20:33:23
让k≥ 0.假设^u=u+ν,其中~ N(0,T∑)为正态分布,∑具有满秩。对于样本内夏普比率和样本外夏普比率之间的差异分布,如下所示:1。如果真夏普比τ*= 0是零,样本外的Sharpe^τ也是零,我们有^ρ- ^τ = ^ρ - 0=kνk∑-1D=√Tχ(k+1)(6),其中χ(k+1)表示自由度为k+1且kxk∑的χ分布(χ分布的平方根)-1=√xT∑-1x。2.如果τ*> 0,我们有,首先,^ρ- ^τ ≤ kνk∑-1D=√Tχ(k+1)(7),因此不确定性由χ-分布限定。第二,ρ- ^τD=Tτ*Z+√TN+R(8),其中Z为χ(k)-分布,N为独立标准正态分布,Ra余数为E[T | R | p]→ 0作为T→ ∞ 尽管如此,p≥ 1.在真夏普比为0的零假设下,等式(6)是方便的,可以通过使用T^ρ服从χ分布来检验。等式(8)具有直观的解释。N项对应于样本数据集中的噪声,z项对应于噪声和估计误差。具有更高的真夏普比τ*, 与真实参数的任何偏差都会变得更加昂贵,因此参数的估计更加精确,Z项的相关性也会降低。在本节结束时,我们证明了均值-方差效用的类似结果,而不是夏普比率作为fit的度量。虽然结果并不新鲜,例如Kan and Zhou(2007)和Hansen(2009)显示的结果与我们的结果密切相关,但我们发现以与此处设置一致的方式呈现这些结果很有启发性。当welater将SRIC与Akaike信息标准(AIC)联系起来时,这尤其有用。对于这个,设^u(θ)=2^uTθ- γθT∑θ为样品中的,u(θ)=2uTθ- γθT∑θ样本外均值-方差效用。

23
可人4 在职认证  发表于 2022-5-10 20:33:27
参数化是这样的,对于γ=1,保持^u(^θ)=ρ(^θ),样本中的平方夏普比。定义2.7类似于定义3.4。样本内均值-方差效用可以分解为^u(^θ)=u(^θ)+NMV+EMV+umvw,其中NMV=^u(^θ)- ^u(θ)*) (噪声拟合),EMV=u(θ*) - u(θ)(估计误差),UMV=u(θ)*) - u(θ)*) (噪音)。现在很容易证明定理3.5(均值-方差的噪声拟合和估计误差)。同意定理3.1的假设。它认为:E[NMV]=k+1γTandE[NMV+EMV+UMV]=2(k+1)γT,尤其是^u(^θ)-2(k+1)γT=γ^ρ-2(k+1)γ是样本外效用u(^θ)的无偏估计量。我们稍后将证明,Akaike信息准则(AIC)可以(经过线性变换后)解释为^u(^θ)-因此,2(k+1)γ可作为样本外效用的无偏估计。4.型号选择(夏普信息标准)4.1。Sharpe信息标准在前面的章节中,目的是量化噪声系数和估计误差,以便了解样本外Sharpe比率。在本节中,我们将结果应用于模型选择。让Θ=Θ˙∪. . .˙∪ΘnwithΘi Rki+1是一系列参数空间。模型选择是关于选择一对(i,θi),即模型i∈ {1,…,n}和参数函数θi∈ Θi.模型选择的一个典型目标是选择样本外fit最高的模型。在本文中,我们通过样本外夏普比率来衡量fit。自然地,样本外夏普比^τ(θi)是一个随机变量,其分布取决于未知数,如真实参数。然而,根据定理3.1,对于无样本夏普比,SRIC是一个无偏估计量,并且只能在样本夏普比等观测值上进行计算。这建议选择SRICSRCI=ρ(^θi)最高的模型i-kiTρ(^θi)(9)一些标准还有其他目标,例如:。

24
kedemingshi 在职认证  发表于 2022-5-10 20:33:30
贝叶斯信息准则(BIC)最大化了选择真实模型的渐近后验概率。式中,只要样本外夏普比率的估计值是感兴趣的变量(即样本外夏普比率分布的第一个时刻),则定理3.1证明了选择标准为^θimaximizesρoverΘi.SRIC。在更高的时刻,事情会变得更复杂。我们参考定理3.3,在那里我们导出了样本外夏普比率的渐近分布。我们现在表明,SRIC与Akaike信息标准(AIC)完全相似,不同之处在于后者使用对数似然比而非夏普比作为测量值。4.2。与AIC的关系为了推导Akaike信息准则(AIC),参见Akaike(1974),我们需要关联θ∈ Θ使用预测并推导其对数似然。也就是说,我们需要先用预测模型来巩固我们的基础,然后才能在这种情况下赋予对数可能性以意义。在附录中,我们展示了定理4.1。对于合适的基础预测模型和合适的参考测量值P:TlogdPθ(pt)t∈[0,1]数据处理(pt)t∈[0,1]= 2^uTθ- θT∑θ。特别是,(在高斯情况下并不奇怪)对数似然是平均方差效用^u的倍数。因此,最大化前者相当于最大化后者。AIC定义为asAIC=-2log似然+2·参数个数,因此我们使用定理4.1AIC=-2 logdPθdP+2(k+1)=-T^ρ+2(k+1),在线性变换后,我们首选的AIC标准化-AICT=^ρ-2(k+1)T.(10)方程(10)表明,我们可以用均值-方差效用或平方夏普比来表示AIC。

25
可人4 在职认证  发表于 2022-5-10 20:33:34
结合定理3.5,这就产生了对AIC的解释,即AIC校正了样本内均值-方差效用的噪声系数和估计误差。备注4.2。SRIC选择了比AIC更高的维度,但两者在T上彼此收敛→ ∞.直觉是,均值-方差投资者将受到惩罚,因为他们在样本估计中高估了太多的风险敞口(杠杆),而Chaic正确地惩罚了这些估计。相比之下,夏普比率不受过度杠杆的影响,因此不需要额外处罚。5.应用定理3.1有充分的应用。无论是在投资组合或资产管理中,在寻找定量交易策略时,还是在学术界询问样本内的异常是否足够强,足以在样本外可行时,这些都存在于对样本外夏普比率的估计感兴趣的地方。它的首次使用是作为样本外夏普比率的无偏估计。在第5.1节中,我们将对此进行说明。正如定理所宣称的,样本外模拟的平均夏普比率与平均SRIC一致。它的第二个用途是作为模型选择标准,类似于Akaike信息标准。图1已经显示了夏普差异曲线,即样本内夏普比率和产生相同估计样本外夏普比率的参数数量的组合。在接下来的章节中,我们将SRIC作为模拟(第5.2节和第5.3节)和真实数据(第5.4节)中的模型选择标准进行说明。为了完整起见,我们还展示了SRIC在回归设置中的应用(第5.5节和第5.6节)。请注意,评估模型选择标准的性能并不是直接的,始终取决于判断。这是因为它的性能取决于未知模型。

26
kedemingshi 在职认证  发表于 2022-5-10 20:33:37
任何偏向未知真实模型的选择标准都是提前开始的。对于模拟或大量数据集,这个问题不会消失。任何模拟都会确定真实模型的先验概率分布,先验确定模型选择标准的最佳偏差。为了克服这一困难,我们i)选择了第一句话中的模拟参数,注意SRICρ-SRICk=Tρ+kρ≥ Tρ=艾克ρ-艾克k、 要查看第二条语句,observeT(SRIC)=T^ρ -kT^ρ= T^ρ- 2k+k^ρT=-AIC+const+k^ρ因此,两者之间存在差异-AIC/T和SRIC的顺序为o(T-1).既不偏向高维模型,也不偏向低维模型;ii)我们在一系列维度上改变了固定的真实模型,并声称SRIC在广泛的真实模型上表现良好,尽管在极端情况下,偏向真实模型的标准优于其他标准。5.1. 模拟1:估计样本外夏普比率我们说明了定理3.1。为此,我们模拟T=1,25年的日收益率(每年252个日收益率),具有不同的自由度和真实夏普比率。然后,我们计算最佳样本内夏普比、样本内夏普比(根据定理3.2 SRIC针对噪声系数进行调整)和样本外夏普比。图2:样本内夏普比、噪声系数和估计误差的调整以及样本外夏普比(当真实夏普比为τ时)*= 0(左侧)或τ*= 参数数量为k=10时为1(右侧)。所有数字都是超过10000次随机抽取的平均值。图2显示了真实夏普比为τ时的结果*= 0(左侧)或τ*= 1(右侧)表示k=10个自由度。所有数字都是超过10000次随机抽取的平均值。

27
大多数88 在职认证  发表于 2022-5-10 20:33:40
正如该定理所宣称的,样本内夏普比(针对噪声和估计误差进行调整)与样本外夏普比(out-of-sample Sharpe ratio)相匹配。5.2. 模拟2:基本模型选择在本节中,我们测试SRIC作为模型选择标准,并将其与模拟中的Akaikei信息标准(AIC)进行比较。例如,T=10年,k=10自由度,τ的真夏普*= 1.我们模拟(rt,i)∈ R252T,k+1所以rt,i等于iid N(u,σ)-分布σ=0.1/√252和u=0.1/(252)√k+1)τ*我们用真实夏普比τ模拟了20维模型的5年*当然是1。20维模型是40维模型(完整模型)的一部分,trueSharpe比率为x≥ 1.我们将第一个模型称为基础模型,第二个模型称为完整模型。我们现在让SRIC和AIC在基本模型和完整模型之间做出决定,并记录样本外夏普比率。当我们改变整个模型的真实夏普比率x时,我们平均超过10000次随机抽取T=5年的样本。图3:根据完整模型的真实Sharpe比率,在基本模型和完整模型之间选择的平均样本外Sharpe比率。平均超过10000次试验。图3显示了结果。如果完整模型的真实夏普比为1.17或更低,则最好使用低维基础模型,其真实夏普比为1。由于AIC倾向于选择低维模型(见备注4.2),因此在sub 1.17区域,其表现优于SRIC。然而,由于真实的夏普比未知,因此低维模型更可取。真实夏普比为1.17或更高时,完整模型的样本外夏普比高于基础模型,SRIC的性能优于AIC。

28
何人来此 在职认证  发表于 2022-5-10 20:33:44
事实上,AIC需要更高的夏普比率才能看到其优势,并克服其对较小基础模型的偏见。这就是τ*= 1.我们模拟(rt,i)∈ R1260,20so表示rt,i独立于N(ui,σ)-分布σ=0.1/√252和ui=0.1/(252)√20)τ*5.3. 模拟3:扩展模型选择我们现在改变真实模型的维度,以查看SRIC在一系列不同真实维度下的表现。为此,我们模拟了T=5年的252日样本收益率,所有收益率都是独立的,年化波动率为10%。我们在1到100之间改变真实模型的尺寸。对于维数为k的真实模型*我们给出了所有维k≤ K*在[0,0.5]范围内均匀分布且所有尺寸k>k的夏普比*夏普比率为0。在候选模型k下,我们了解由前k个维度1,k,这在样本中是最优的。我们根据SRIC和AIC选择模型^k,并表示相应的样本外夏普比率。我们还注意到完整模型(Markowitz)和1D模型(仅选择FirstDimension,即k=1)的样本外夏普比率。图4:根据不同选择标准的真实模型尺寸,样本外夏普比率的平均值。平均超过10000次试验。图4显示了根据选择标准,真实模型不同维度的样本Sharperatios的相应平均值(超过10000张)。为了进行比较,灰色虚线显示了truemodel的样本外夏普比率。当然,真正的模型是未知的,因此它的夏普比率是无法达到的。也就是说,我们首先均匀地画出^x[0,1],并以^x为条件,我们有rt,i~ N(ui,σ),σ=0.1/√如果i≤ K*其他0,独立于t=1,1260和i=1,100.可以看出,SRIC在整个范围内表现良好。

29
kedemingshi 在职认证  发表于 2022-5-10 20:33:47
它跟踪未知真实模型的性能形状。对于7到61之间的真实尺寸,它在所有模型选择标准中具有最高的样本外性能,即SRIC、AIC、1D模型和完整模型。在该范围之外,偏向于真实维度的选择标准表现得更好。当真实模型的维度较高时(≥ 62)全模型具有较高的样本夏普比;但当然,由于真实模型的维数未知,所以整个模型是最优的。当真实维度较低时,倾向于选择低维度的1D模型或AIC优于通过SRIC进行的完整模型和选择。尽管如此,SRIC至少排名第二,除了k*= 1在AIC和1D模型之后。最值得注意的是,与AIC不同,它得益于更高维度的可预测性。5.4. 真实数据:10个行业组合我们现在在Kenneth French的网站上的10个行业组合上展示SRIC作为趋势系统的模型选择标准。我们使用1963年1月2日至2016年7月29日的每日数据。首先,我们减去联邦基金利率以获得超额回报。在每个月的开始,我们做以下事情。我们回头看lb=1,120个月,根据每日数据计算主成分,得到10个因子。准确地说,我们选择等重投资组合作为第一个因子(而不是PCA的第一个分量),然后在与第一个因子正交的空间上计算剩余的主分量。我们这样做是为了在等权重和马科维茨投资组合之间进行插值。通过模型k=1,10我们指的是在前k个系数1、…、的基础上,使上一个磅月的样本内夏普比率最大化的投资组合,K

30
能者818 在职认证  发表于 2022-5-10 20:33:50
通过这种方式,模型k在等权投资组合(k=1)和完整的马科维茨投资组合(k=10)之间插值。在每个月初,我们让SRIC和AIC选择模型k,并为下一个月应用权重。为此,我们总是根据样本数据(即最后一个月)将投资组合的年化波动率调整为10%。由于我们关注横截面上的投资组合选择,并且不试图通过具有时变风险敞口来计时市场,因此我们将规模扩大到恒定波动性。通过这种方式,我们得到了从1973年1月1日到2016年7月29日的一系列样本申报。我们改变了投资组合形成的回望lb。虽然在较长的时间范围内,可能只有一个奖励因素,即市场,但在较短的时间范围内,可能有几个行业特定的趋势。因此,根据回溯,性能最佳的模型的尺寸可能会有所不同。http://mba.tuck.dartmouth.edu/pages/faculty/ken.french/ftp/10_Portfolios_Prior_1_0_CSV.zipE有效基金利率,每日系列,从美联储获得http://www.federalreserve.govFigure5(10个行业组合):左:1到120个月回顾的夏普比率,用于不同的模型选择标准。右图:回顾6个月的累积回报率。对于SRIC、AIC、Markowitz和等权重的选择,夏普比率分别为0.56、0.44、0.56和0.39。结果如图5所示。左面板显示了等权投资组合、马科维茨投资组合和根据SRIC和AIC的投资组合选择(取决于回溯)的样本外夏普拉蒂奥。右面板显示了6个月的equitycurves。有几件事值得注意。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 08:11