楼主: nandehutu2022
1593 30

[量化金融] 基于贝叶斯多重检验的稀疏投资组合选择 [推广有奖]

11
可人4 在职认证  发表于 2022-5-31 11:30:41
这里,C+(0,1)表示半柯西分布,位置参数为0,比例参数为1,对应的pdf asf(τ)=2I(τ>0)π(1+τ)。尺度参数τ在控制估计量的收缩行为方面起着至关重要的作用。它被称为“全局收缩参数”,Datta和Ghosh【2013年】,因为它根据数据中的总体稀疏性进行调整。∧表现为局部收缩参数。注意,我们考虑了τ上的半柯西先验[Gelman,2006]。Carvalho等人【2009、2010】表明,这种先验规范适用于高维稀疏解问题,并将其命名为“马蹄先验”。当数据稀疏时,τ的后验概率集中在零附近(p→ 0)。Wede FINE?θ=P-1PXi=1θi,V=(P∧+C-(1)-1、θi、σi、∧和θ的吉布斯取样器为[θi | X,ri,uc,λ,σi]~ Nk+1(mi,∑)-1i),其中∑i=XTXσi+∧τ,mi=∑-1i(XTriσi+∧τu)。[σi | ni,ri,θi]~ InvGammaν+ni,ν+(ri- Xθi)T(ri- Xθi),[λ|θi,P,R,ρ,uc]~ W ishartn公司PXi=1(θi- uc)(θi- uc)T+ρR-1,P+ρo,[θ| V,P,∧,C,u]~ Nk+1V(P∧θ+C-1u),V.我们对τ进行了Metropolis Hastings更新。4渐近最优性【Bogdan等人,2011年】引入了“稀疏条件下的渐近Bayes最优性”(ABOS)的概念。在【Datta和Ghosh,2013年】中,这一点被扩展以显示单组模型的最优性。特别是,如果马蹄先验的全局收缩参数τ被选择为与p相同的阶数,那么马蹄先验诱导的自然决策规则将获得高达O(1)的贝叶斯预言风险,其常数接近于预言中的常数。在单参数设置中,已经进行了几项研究。这里我们将这些结果扩展到多参数设置。我们工作的渐进框架是由【Bogdan等人,2011年】推动的。

12
何人来此 在职认证  发表于 2022-5-31 11:30:44
为了将结果推广到(k+1)维情况,我们需要以下假设。假设(A):一系列参数向量{γt=(pt,∧0t,σit,δt);t∈ {1,2,····}}如果满足以下条件,则满足此假设:pt→ 0,σit∧0t→ 0,vt:=(det(I- Qit))-1ftδt→ ∞,utlog(vt)→ C∈ (0,∞),式中,Qi在式(3.2)中定义,f和δ在式(3.4)中定义。λji,j=1,···,k+1是Qand ut的非零特征值:=Qk+1j=1(1- λjit)1/(k+1)。定理1。假设A下,t1i→ 0和t2i→ P(χ(k+1)≤ C) 。特别是,对于k=1,t2i→ 1.- e-C/2。证据从第3.1节可以看出,在零假设下,Si是k+1独立χ随机变量的线性组合,权重λji,j=1,···,k+1是Qi的非零特征值。假设A下,vt→ ∞. 因此,对于假设的最后一部分,每个λji,j=1,···,k+1必须收敛到1,作为t→ ∞. 因此,Si=> χk+1,其中=> 表示分布收敛。根据vt的假设→ ∞, 我们有ci→ ∞ 因此t1i→ 在替代假设下,Si是k+1个独立χ随机变量的线性组合,权重为λji/(1)- λji),j=1,···,k+1。在假设A下,λji,j=1,···,k+1收敛到1。因此utSi=> χk+1。此外,utlog(v)→ C、 因此t2i→ P(X≤ C) 其中X是χk+1随机变量,因此为结果。备注5。根据上述定理,我们可以得出结论,在贝叶斯预言下,风险的形式为Ropt=P PδAP(χ(k+1)≤ C) 。定义1。考虑满足假设a的一系列参数γt。如果γt的风险满足要求,我们将其称为多重测试规则abo→ 1作为t→ ∞我们提出了一种替代测试,拒绝区域▄Si>ci,其中ci如等式(3.3)所定义,且▄Si=(ri- Xu)σiTX(XTX)-1XT(ri- Xu)σi.<<Si的优点是它不依赖于∧。我们证明这个新的测试是ABOS。定理2。

13
何人来此 在职认证  发表于 2022-5-31 11:30:47
当且仅当cit→ ∞ 和citut→ C、 证明。在H下,Si=(ri- Xu)σiTQ(ri- Xu)σiis–Q=X(XTX)的标准多元正态中的二次型-秩k+1的1x对称幂等元。因此▄Si~ χk+1和t1i=P(~Si>cit)→ 0当且仅当cit→ ∞. 在备选方案下,Zi=(ri- Xu)σiTA-1/2为标准正常值,且▄Si=ZTiA1/2i▄QA1/2iZ。So(det(Ai))-1/(k+1)Si=> χk+1。此外,det(Ai)=Qk+1j=1(1- λji)。TheABOS属性现在使用备注5建立。贝叶斯错误发现率(BFDR)是由[Efron和Tibshirani,2002]引入的,因为BFDR=P(他的真实|他的拒绝)=(1- p) t(1- p) t+pt。可以看出,多个测试程序将BFDR控制在一个小的α水平,在最小化误分类错误方面表现得非常好,参见【Bogdan等人,2007年】。考虑一个基于▄Si的固定阈值规则,BFDR等于α。在混合模型(3.1)下,可通过求解方程(1)获得相应的阈值Cc- p) e类-c/2(1- p) e类-c/2+pe-c/2ut=α(4.1)定理3。考虑一个固定阈值规则,BFDR=α=αt。该规则是ABOS当且仅当它满足以下两个条件srα/f→ 0,其中rα=α/(1- α) (4.2)和2 log(rα/f)1-ut公司→ C、 (4.3)该规则的阈值为Ct=C- 2对数(rα/f)+o(t)。(4.4)证明。假设测试是ABOS。方程式(4.1)相当于top1- pα1- α=e-c/2(1-ut)根据定理2,右手边为零。这意味着左侧=rα/f变为零,建立了第一个条件。简化方程式(4.1)并使用citut→ C我们有,2 log(rα/f)=ct+C+o(t)(4.5),也就是说,阈值的形式由方程(4.4)给出。此外,cit=C/ut+o(t)。将其与方程(4.5)相结合,我们得到第二个条件。现在我们证明了相反的情况。假设BFDR=α的测试满足这两个条件。让我们定义ztas zt=citu。

14
mingdashike22 在职认证  发表于 2022-5-31 11:30:51
这样的测试满足性方程(4.1)。因此,2 log(rα/f)=zt(1-ut)。结合方程式(4.3),我们得到了zt→ C、 同样,根据方程式(4.4),2 log(rα/f)=zt- ct。结合方程式(4.2)和zt→ C、 我们有ct→ ∞.现在利用定理2,检验是ABOS。~Si的切割值c是方程式(4.1)的解。这个c仍然是未知参数的函数,不能在实践中使用。注意,当稀疏性参数p和模型参数λjare固定时,c是测试水平α的单调递减函数。因此,为了实现目的,我们没有试图明确获得c,而是确定我们将拒绝无效假设的测试比例。这相当于组合中包含的资产比例。这可以控制最终投资组合的规模。从财务角度来看,这也是可取的,因为竞争投资组合只有在规模相同时才具有可比性。5模拟研究在本节中,我们介绍了四种不同的模拟研究。在实验1中,我们比较了Si和▄Si的性能。在第二个实验中,我们将Bayes-oracle估计器的性能与Diffuse-prior和LARS-LASSO Fan等人[2012]等其他方法进行了比较。在第三个实验中,我们比较了拟议的▄SI选择的投资组合包含oracle集合的概率,作为市场规模、样本规模和地区风险的函数。在第四个实验中,我们研究了因子数k对▄Si性能的影响。对于前三个实验,我们考虑单因素CAPM以保持简单,并从方程(2.1)给出的真实模型中模拟数据,σi=所有i的σ。在不丧失一般性的情况下,我们假设前[pP]许多股票的定价不公平。也就是说,我们分别从N(0,0.1)和N(1,0.1)中模拟α和β干扰素。

15
kedemingshi 在职认证  发表于 2022-5-31 11:30:55
对于其余股票,α和β设置为(0,1)。实验1:在这项研究中,我们考虑了两种不同的▄P选择,即▄P=100和500,样本大小从n=20到n=50不等,间隔为5。注意,由于空间限制,我们在图1中给出了n=20和n=50的结果。我们允许稀疏性参数p在0.01到0.9之间以0.01的间隔变化。我们选择σ的两个不同值为0.1和0.05。最后,我们设置∧=0.5 0.30.3 0.7. 对于所有这些不同的n、~P、α、β、σ选择;我们模拟了1000个数据集。对于每个数据集,我们计算所有i=1,2,···,P的Siandsif。在标准贝叶斯变量选择策略中,要么使用后验包含概率,见Datta和Ghosh【2013年】,要么使用可信区间,见van der Pas等人【2017年】。我们采用另一种策略,为最终投资组合选择固定数量的资产。例如,在给定的模拟数据集中,我们计算了所有i=1,2。。。P。然后,我们选择P=25多个资产,对应的▄Siare最高。我们放弃标准贝叶斯变量选择策略的原因如下。固定阈值策略或概率包含策略可以在一个数据集中选择密码集。然而,在另一个数据集中,它可以选择Passets。因此,这两个投资组合不具有可比性,因为协方差矩阵具有不同的维度。我们希望在所有模拟的1000个数据集中保持文件夹大小相同,以便进行公平比较。在所有四个实验中,我们都遵循这里提出的投资组合选择策略。基于1000多个数据集的决策,我们计算了I型错误、II型错误、贝叶斯错误发现率(BFDR)和误分类概率(PMC);并将结果显示在图1和图2中。我们报告了实验1的以下观察结果。观察1。

16
可人4 在职认证  发表于 2022-5-31 11:30:58
当稀疏度趋于0时,图1的所有四个面板中的I型误差都变为0。在图1的所有面板中,稀疏度接近0,II型误差不会达到1。有界II型误差保证了ABO的特殊统计能力。该观察结果验证了定理1.2。从图1的所有四个面板中,我们观察到,对于n、P、σ和稀疏度P的不同选择,所有四个指标都是SiandSioverlap。因此,验证了定理2.3。随着样本量n的增加,II类错误概率和误分类概率都会增加。这表明即使稀疏性参数p接近零,统计功率也在增加。4、作为p→ 1,即模型变得稠密,不应使用此测试,因为i型误差增加。然而,当稀疏度达到0.5时,I型误差保持在5%以下。在图1的所有四个面板中,无论n、P、σ和P.6的值如何,BFDR约为0.05。图2表明,通过将库存数量从P=10增加到P=500,测试的所有指标都变得更加平滑。实验2:在本研究中,我们考虑P=500,样本量n=20,σ=0.1和∧=0.5 0.30.3 0.7. 对于所有这些参数的选择,我们模拟了1000个数据集。对于每个数据集,我们计算▄s并做出决策。我们还可以使用Diffuse Previor和LARS-LASSO技术做出决策,并与oracle进行比较。根据1000个数据集中的决策,我们计算了I型错误、II型错误、贝叶斯错误发现率(BFDR)和误分类概率(PMC),并将结果显示在图3中。观察1。当稀疏度趋于0时,ABOS的I型误差变为0。在似然检验中,I型误差在稀疏度的不同值中达到5%的水平。LARS LASSOmethod的I型错误概率也表现出一种偏差行为,如使用前的差异。

17
可人4 在职认证  发表于 2022-5-31 11:31:00
然而,它比Diff-UsePrevior方法更重要。同样,LARS套索的II类错误概率、BFDR和误分类概率均高于Diffuse Previor方法。2、如果我们比较三种方法的II型误差、BFDR和PMC,那么本文提出的ABOS检验都优于其他两种方法。注:我们试图用马蹄先验方法比较ABOS检验与层次贝叶斯(HB)检验。然而,考虑到计算能力,对于一个固定的稀疏性参数,对1000个模拟数据集实施HB方法需要大约三天的时间。对于每个数据集,我们在5000次老化后模拟了25000个MCMC模拟。对于实验2,我们认为稀疏度范围为0.01到0.9,间隔为0.01。对于一个稀疏值,大约需要三天,对于所有90个可能的值,假设系统中没有可能的中断,大约需要270天。因此,由于缺乏计算资源,我们无法实现比较。因此,我们将此任务作为未来的研究项目。实验3:本研究的目的是比较真实oracle投资组合和通过ABOS测试方法选择的portfolioselected的投资组合回报。我们模拟了1000个数据集。在每个数据集中,我们从实验1中描述的模型中模拟了40个样本。我们考虑20个样本用于培训,其余样本用于测试。在整个美国,市场规模为P=500。我们认为投资组合规模为▄P=100和▄P=50。我们考虑σ的两种不同选择,分别为0.03和0.01。我们假设5%(即q=25)的股票具有非零α。本研究考虑oracle投资组合(表示为APq)和ABOS投资组合(表示为BP)。在oracleportfolio中,将始终选择25只股票以及其他随机选择的75只股票。

18
何人来此 在职认证  发表于 2022-5-31 11:31:05
在ABOS投资组合中,所有股票都是根据▄Si选择的。我们认为两个投资组合的权重相等。观察结果:1。在表(1)中,我们给出了1000个合成数据集的样本外中值回报。真正的甲骨文投资组合和ABOS投资组合的中位回报率在四种不同的选择▄P和σ中是相似的。2、在图(4)中,我们展示了真实oracle投资组合和ABOS投资组合1000个合成数据集的并排箱线图。目视检查表明,ABOS产品组合的性能与oracle产品组合相似/相当。实验4:本研究的目的是调查因素数量对投资组合选择程序绩效的影响。我们比较了CAPM和四因素模型之间所选投资组合包含oracle投资组合的概率。请注意,CAPM模型实际上是一个单因素模型,其中市场指数引起的风险溢价是唯一因素。观察结果:1。在图(5)中,我们给出了所选投资组合包含oracle投资组合的概率折线图。目视检查表明,四因素模型的ABOS投资组合的统计能力优于单因素CAPM。6实证研究在实证研究中,我们考虑了从2006年1月到2018年10月的大约十三年的日收益率。选择这一时期的目的是研究这些方法的行为,特别是在2008年和2011年的压力期间。我们考虑了大约500只在纽约证券交易所上市的股票。我们于2018年11月1日下载了500只股票的每日调整收盘价。此外,我们还下载了标准普尔500指数、道琼斯工业平均指数(DJI)、纽约证券交易所综合指数(NYSEC)、罗素2000指数和芝加哥期权交易所波动率指数(又名VIX)的每日收盘价。

19
mingdashike22 在职认证  发表于 2022-5-31 11:31:08
所有数据均从Yahoo Finance下载(https://finance.yahoo.com/)。以下GitHub存储库中提供了所有R代码和数据:https://github.com/sourish-cmi/sparse_portfolio_Bayes_multiple_test.我们认为标准普尔500指数是基准市场指数,DJI、NYSEC、Russell2000和VIX等指数是五因素模型中的附加因素。请注意,在这十三年期间的部分时间内,某些库存不可用。最初几年,每日收盘价约为400只股票。我们利用可用的股票价格进行了分析。我们每月进行以下分析。在第三个月,我们在第三个月的每日收益上运行第(3)节所述的建模过程。P=500许多资产的超额回报率超过无风险利率r。。。,rPin市场和P n、 这里n通常是22或23天的返回时间,因为一个月只有那么多的营业日。我们使用第3节中所述的方法,选择▄P=25多个资产,该方法适用于第三个月的每日收益。我们选择价格过低的股票,我们(t+1)月的修订投资组合将由这些价格过低的股票组成。一旦我们为投资组合选择了▄P=25多个资产,那么问题就归结为投资组合分配。通常,投资组合经理会求助于马科维茨优化的解决方案。然而,我们意识到,如果我们求助于马科维茨的优化,我们将无法区分业绩的提高是由于投资组合选择还是由于马科维茨的投资组合分配。为了消除投资组合分配的影响,我们始终考虑了等权投资组合。

20
kedemingshi 在职认证  发表于 2022-5-31 11:31:11
请注意,我们还使用马科维茨的优化单独实现了结果,并在补充材料的附录B中给出。我们观察到,对于马科维茨的加权投资组合,样本外风险和回报是不同的。但由于马科维茨的优化,我们没有观察到任何重大改进。我们在t+1月份投资选定的股票,同时计算投资组合和标准普尔500指数的样本外回报。我们认为抽样期为2006年1月1日至2018年10月31日。例如,我们对2007年12月的股票价格进行统计处理,识别出25只股票,并使用2008年1月的等权重构建投资组合,只投资这些股票。我们每个月都会重复这个过程。权重相等的投资组合的绩效如图6所示。图7显示了样本中四种不同策略的性能。在这里,标准普尔500指数被视为基准投资组合,因为许多投资者作为被动投资者投资于标准普尔500指数基金。如果我们看一下图(6:a),除了两年(20082012),“马蹄形因子模型”选择策略在年度回报方面优于基准指数。在13年中,有五年(2008年、2011年、2013年、2017年、2018年)Fan的LARS-LASSO选择流程在年度回报方面低于基准。同样,在相同的13年中,有六年(2006年、2008年、2010年、2015年、2017年、2018年)的CAPM选择过程在年度回报方面低于基准。除三年(2011年、2017年、2018年)外,factormodels with Bayes oracle strategy在年回报率方面优于基准指数基金。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 07:00