楼主: 可人4
1469 48

[量化金融] 用机器方法降低均值-方差组合的估计风险 [推广有奖]

41
能者818 在职认证  发表于 2022-6-9 21:54:00
主要结果是,ML方法能够获得与等权重策略相似的夏普风险,但使用Lasso估计的投资组合权重仅显示少数非零资产。图9b绘制了等权重策略中的资产数量以及Lasso选择的非零资产数量。从广义上讲,在套索的情况下,每个时间段用于形成订单的资产不到10项。表4的最后一栏中报告了大型标准普尔投资组合的结果。同样,这是一个极具挑战性的估计问题,传统方法和最小方差组合不可行,因为估计样本量为60个月,资产数量为500。在这种高维情况下,ML方法在Sharpe比率方面表现出同等权重的投资组合,尽管不明显。这与DeMiguel、Garlappi和Uppal(2007)的研究结果相反,有人认为,等权策略优于其他方法100 120 140 160 180 200评估月-150-100-50Classiclaso(a)样本投资组合m ean0 5 10 15 20 25 30 35 40 45评估月assivelasso(b)非零资产数量图9:稀疏投资组合和估计风险。图9a显示了基于m=50资产的标准普尔数据的传统appr-oach和Lasso的样本外回报。传统的方法在样本结束时产生高度不稳定的回报。相比之下,Las在这一时期选择了零投资政策。图9b根据cr-yptocurrency数据绘制了均衡权重被动策略(所有资产)和套索中的非零资产数量。在文献中讨论。

42
kedemingshi 在职认证  发表于 2022-6-9 21:54:03
附录B中的表6和表7分别报告了平均portf olio均值和标准偏差的进一步结果。6结论我提供了一个统一的ML框架,用于估算可选ima l港口对账单权重,其中权重是通过对常数上的超额资产回报进行“回归”获得的。研究人员和从业者应考虑MLframework,原因有几个。首先,该框架意味着可以使用任何“货架效应”线性最大似然法来估计最佳por tfolio权重。通过ML(可能是简化实现)进行投资组合优化,因为标准统计软件中提供了此类学习算法。因此,交叉验证和估计可以使用有良好记录和标准化的软件进行,并有多种诊断检查选项。其次,f r amework可以用来为传统方法和最近提出的收缩方法提供新的思路。由于传统方法是等效线性回归,因此该方法产生的巨大估计风险可以解释为回归意义上的过度。ML框架可用于推导传统方法与DeMiguel等人(2009)提出的正则化方法之间的联系。特别是,我展示了岭和套索权重估计与传统权重估计之间的关系,并提供了岭回归何时可以在估计风险方面优于传统方法的条件。第三,我介绍了两种新的投资组合估计方法:主成分回归和尖峰板回归。本质上,我记录了这些方法的形式类似于基于模拟和经验数据的岭回归和套索回归。最后,本文提供的ML框架为未来的研究提供了一个有希望的方向。

43
nandehutu2022 在职认证  发表于 2022-6-9 21:54:06
具体而言,命题1可以扩展到非线性模型,从而基于复杂的ML算法(如回归树或随机森林)估算港口对账单。然而,从这些方法中推翻投资组合权重估计并非易事。ReferencesBan、Gah Yi、Noureddine El K aroui和Andrew EB Lim。2016年,《机器学习和投资组合优化》《管理科学》,63(3):1136–1154。Best、Michael J和Rober t R Grauer。1991年,“平均方差有效投资组合对资产均值变化的敏感性:一些分析和计算结果。”《金融研究回顾》,4(2):315–342。布莱克、菲舍尔和罗伯特·利特曼。1992年,《全球投资组合优化》《金融分析师杂志》,48(5):28–43。Britten Jones,马克。1999年,“平均方差组合权重估计中的抽样误差。”《金融杂志》,54(2):655–671。布罗迪、约书亚、英格丽德·道贝奇斯、克里斯蒂娜·德莫尔、多梅尼科·吉安诺和伊格纳斯·洛里斯。马科维茨投资组合稀疏且稳定国家科学院学报,10 6(30):12267-12272。DeMiguel、Victor、Lorenzo Garlappi和Raman Uppal。2007年,“最佳的Versunaive多元化:1/N投资组合策略的效率如何?”《金融研究评论》,22(5):1915-1953年。DeMiguel、Victor、Lorenzo Garlappi、Francisco J Nogales和Raman Uppal。投资组合优化的通用方法:通过限制投资组合规范来提高绩效管理科学,55(5):798–812。埃夫隆、布拉德利和特雷弗·黑斯蒂。2016,《计算机时代统计推断》。第5卷,剑桥大学出版社。范建清、张京津、柯瑜。2012年,“grossexp-osure约束下的大规模投资组合选择。”《美国统计协会杂志》,107(498):592–606。Friedman、Jerome、Trevor Hastie和Rob er t Tibshirani。201 1.

44
nandehutu2022 在职认证  发表于 2022-6-9 21:54:09
统计学习的要素:数据挖掘、推理和预测。第二卷,斯普林格。乔治、爱德华一世和罗伯特·麦卡洛赫。1997年,“Bayesian变量选择方法”《中国统计》,7(2):339–373。格林、理查德·C和伯顿·霍利菲尔德。1992年,“平均方差有效投资组合何时才能充分多样化?”《金融杂志》,47(5):1785-1809。Hayashi,Fumio。2000年,《经济计量学》。普林斯顿大学出版社。霍尔、阿瑟·E和罗伯特·W·肯纳德。岭回归:非正交问题的偏差估计技术计量学,12(1):55–67。Jagannathan、Ravi和Tongshu Ma。2003年,“大型投资组合的风险降低:为什么施加错误的约束会有所帮助。”《金融杂志》,58(4):1651–1683。詹姆斯、加雷斯、丹妮拉·维滕、特雷弗·黑斯蒂和罗伯特·提比希拉尼。2013,《统计学习导论》。斯普林格。Jobson、J Dave和Bob M Korkie。1981年,“使用Sharpe和Treynor测度进行假设检验。”《金融杂志》,36(4):889–908。乔里昂,菲利普。19 85. “具有估计风险的国际投资组合多元化。”《商业杂志》,58(3):259–278。乔里昂,菲利普。1986年,《投资组合分析的Bayes-Stein估计》《金融和定量分析杂志》,21(3):279-292。Klein、Roger W和Vijay S Bawa。1976年,“估计风险对最优投资组合选择的影响。”《金融经济学杂志》,3(3):215–231。Ledoit、Olivier和Michael Wolf。2004年a。“Ho ney,我缩小了样本协方差矩阵。”《投资组合管理杂志》,30(4):110–119。Ledoit、Olivier和Michael Wolf。2004年b月。“大维协方差矩阵的条件良好估计。”多变量分析杂志,88(2):365–41 1。Levy、Haim和Harry M Markowitz。1979年,“用均值和方差函数逼近预期效用。”《美国经济评论》,69(3):308–317。马科维茨,哈利。1 952.

45
nandehutu2022 在职认证  发表于 2022-6-9 21:54:12
“投资组合选择。”《金融杂志》,7(1):77–91。梅梅尔,克里斯托夫。2003年,《夏普比率的性能假设检验》财务信函,1(1):21–23。Mitchell、Toby J和John J Beauchamp。1988年,《线性回归中的贝叶斯变量选择》《美国统计协会杂志》,83(404):1023–1032。Murphy,Kevin P.2012年。机器学习:概率论视角。麻省理工学院出版社。Scott、Steven L和Hal R Varian。2014年,“用Bayesian结构时间序列预测现状。”《国际数学建模与数值优化杂志》,5(1-2):4-23。西奥博尔德,厘米。均方误差的推广应用于ridgeregression皇家统计学会杂志:B辑,36(1):103–106。附录A方程式(4)的推导。假设xis non-r andom和yis是根据toy=f(x)+ε绘制的。使用(3)我们得到fq=ETnEy[(y-^fq(x))]o=ETnEy[y+^fq(x)-2y^fq(x)]o=ETnf(x)+φ+^fq(x)-2f(x)^fq(x)]o=(f(x)- ET[^fq(x)]+VT[^fq(x)]+φ(A.1)最后一个等式使用ET[^fq(x)]=VT[^fq(x)]+ET[^fq(x)]。公式(6)的证明。设x为风险资产的回报。投资组合收益率由rfθf+~x′θ给出,代理的优化问题是maxθf,θ{E[u(rfθf+~x′θ)]}s.t.θf+1′θ=1(A.2),其中1是1的m×1向量。在约束中进行替换会得到优化问题maxθ{E[u(rf+x′θ)]},其中超额回报由x=~x给出- 1rf。命题1的证明。将以下单调变换应用于(5)~u(r)=2αu(r)-α= -α- r(A.3)插入回路r=rf+x′θ,以获得▄u(rf+x′θ)=-1.- αrfα- x′θ= -((R)r-x′θ)(A.4),其中r=(1- αrf)/α。

46
nandehutu2022 在职认证  发表于 2022-6-9 21:54:15
通过取x的期望值,g一般化误差定义为f(θ)=-Ex[~u(rf+x′θ)]=Ex[(\'r- x′θ)](A.5)由于▄u是u的单调变换,因此直接得出arg maxθEx[u(rf+x′θ)]=arg minθF(θ)。因此,解θ*最大化预期二次效用的方法等价于最小化推广误差的方法。公式(8)的证明。使用xF(θ)=((R)r)的已知分布写出泛化错误(7)- u′θ)+θ′∑θ=\'r-2u′θ′r+θ′u′θ+θ′∑θ=\'r-2u′θ′r+θ′(∑+u′)θ(A.6)取θ的导数给出一阶条件-2u′r+2(∑+u′)θ=0(A.7)求解θ得到θ*= (Σ + uu′)-1u?r(A.8),即方程式(8)。或者,可以通过最大化预期二次效用Ex[u(rf+x′θ)]=rf+u′θ来获得相同的公式-α(θ′∑θ+(rf+u′θ))直接来自(6)。命题2的证明。使用(A.6),最小概化误差为f*= F(θ*) = \'\'r- 2θ*′u′r+θ*′Aθ*(A.9)通过使用(8),我们可以将其替换为u′r=Aθ*, givingF公司*= \'\'r- 2θ*′Aθ*+ θ*′Aθ*= \'\'r-θ*′Aθ*(A.10)类似地,可以使用样本外返回x的分布来编写算法q的预期广义误差r~ N(u,∑)asFq=ET{Ex[(\'r- x′θq)]}=ET{r- 2^θ′qu′r+^θ′qA^θq}(A.11)用in代替u′r=Aθ*现在给定fq=ET{r-2^θ′qAθ*+^θ′qA^θq}(A.12)通过加和减θ*′Aθ*we getFq=(R)r-θ*′Aθ*+ ET{(θ)*-^θq)′A(θ*-^θq)}=F*+ ET{(θ)*-^θq)′A(θ*-(θq)}(A.13)因此,我们可以将估计风险定义为rq=Fq-F*= ET{(θ)*-^θq)′A(θ*-(A.14)二次型的期望由规则E[x′Ax]=E[x′AE[x]+tr(AV[x])确定。在我们的例子中,定义x=θ*-^θqgiving ET[x]=θ*- ET[θq]和VT[x]=ET[(θ*-^θq-(θ*-ET[θq])(θ*-^θq-(θ*-ET[θq]))\'=ET[(θq-ET[^θq](^θq-ET[^θq])\'=VT[^θq]。

47
kedemingshi 在职认证  发表于 2022-6-9 21:54:19
使用expection规则,我们得到rq=(θ*- ET[θq])A(θ*- ET[^θq]+trAVT[^θq](A.15),完成方程式(12)的proo f.证明。与Britten Jones(1999)相似,我们可以将(8)扩展为θ*= (Σ + uu′)-1u?r=Σ-1.-Σ-1uu′Σ-11 + u′Σ-1uu′r=\'r1+u′∑-1uΣ-1u(A.16)计算相关权重得出相切组合ω*=θ*′θ*=Σ-1u′Σ-1u.命题3的证明。首先推导最优投资组合权重回归公式的一些性质'r=Xθ是有用的*+ε、 式中,εHas表示E[ε]=(R)r-u′θ*方差V[ε]=θ*′Σθ*. 因此,φ=E[ε]=E[ε]+V[ε]=(\'r- u′θ*)+ θ*′Σθ*= F*(A.17)估计风险和相应的二阶矩arrq=ET{(θ*-^θq)′A(θ*-^θq)}和Mq=ET[(^θq- θ*)(^θq- θ*)′] (A.18)使用Theobald(1974)的结果,可以得出如下结论:如果A是正半定义,则A 0,然后是M- M 0当且仅当R- R≥ 0表示q=1,2。因此,我们可以在下面的分析中重点讨论二阶矩阵M。我们可以把它写成一个sMq=Vθq+Eθq- θ*]E[^θq- θ*]′(A.19)当省略下标q时,I指传统方法,当使用下标“R”时,I指岭回归。对于t传统(OLS)方法偏差为零,E[^θ]=θ*, 方差为V[^θ]=φ(X′X)-1,给出M=φ(X′X)-1、对于岭回归,估计量可以用传统的方法表示,如^θr=W^θ,其中W=(I+λ(X′X)-1)-因此,岭回归是有偏差的,E[^θR]=Wθ*, 相应方差V[^θR]=φW(X′X)-1W′,givingMR=φW(X′X)-1W′+(Wθ*- θ*)(Wθ*- θ*)′(A.20)从这些众所周知的结果可以看出- MR=λB-1n2φI+λφ(X′X)-1.- λθ*θ*′产科医生-1(A.21),其中B=X′X+λI。Theobald(1974)表明,如果λ<2φ/θ,则该表达式对于λ>0是正的*′θ*式中φ=F*.公式(27)的证明。

48
何人来此 在职认证  发表于 2022-6-9 21:54:22
使用泽尔纳的g先验(Vη)-1=gnX′ηXη后验方差Ivη=(X′ηXη+gnX′ηXη)-1=nn+g(X′ηXη)-1(A.22)后验平均值采用X′ηy=(X′ηXη)^θη作为θη=nn+g(X′ηXη)-1((X′ηXη)θη+gn(X′ηXη)θη)=nn+gθη+gn+gθη(A.23)附录B附加表策略MV Ridge Lasso PCR Spike&Slab Min VARINCE MV CRidge 0.26***Lasso 0.25***-0.01PCR 0.22***-0.04-0.03 Spike&Slab 0.28***-0.02 0.03 0.06Min VARINCE-0.29***-0.55***-0.54***-0.51***-0.57***MV-C-0.28***-0.54***-0.53***-0.50***-0.56***0.01等重-0.14-0.40***-0.40***-0.36***-0.42***0.14*0.14**表5:等夏普比率的Jobson和Korkie成对检验。表中显示,对于S&P-20数据,allML方法(岭、套索、PCR、尖峰和板)显著优于传统方法(MV)和基准策略(最小方差、MV-C和等权重)。该表报告了夏普比率(行策略q减去列策略l)的差异,以及基于Jobson和Korkie(1981)开发的检验统计量^zql的显著性水平。星号***、**和*分别表示1%、5%和10%的显著水平。策略S&P-20 S&P-50 IND-30 IND-49 C-200 S&P-500MV-0.20-0.46 0.63-0.07-机器学习岭1.03 1.04 0.76 0.62 38.18 0.73套索0.93 1.00 0.54 0.82 16.40 1.00PCR 0.92 1.08 0.92 0.48 11.91 0.44尖峰和板1.01 0.68 0.45 0.40-1.55 1.05基准最小方差-1.08-1.14 0.51 0.30-MV-C-1.02-0.98 0.69 0.68 4.05-1.36等权重-0.79-0.77 0.84 0.88 12.95 0.31表6:投资组合平均值对于经验数据。表3中描述的每个策略和每个数据集的样本外投资组合平均值,即公式(30)的数值。

49
大多数88 在职认证  发表于 2022-6-9 21:54:26
第5.1节讨论了估算详情。战略S&P-20 S&P-50 IND-30 IND-49 C-200 S&P-500MV 15.25 17.05 10.69 10.12-机器学习岭4.15 4.41 5.03 4.71 121.64 2.78Lasso 3.88 4.35 7.26 7.88 50.55 4.93PCR 4.47 4.49 5.95 6.36 55.28 2.28尖峰和板3.75 4.33 3.95 4.00 26.90 4.65基准最小方差3.61 3.81 3.30 3.72-MV-C 3.50 3.42 3.28 3.33 26.50 11.39等权重5.11 4.51 4.59 4.57 37.93 2.56表7:投资组合标准经验数据的偏差。表3中描述的每个策略和每个数据集的样本投资组合标准偏差的平均值,即公式(30)的分母。第5.1节讨论了估算细节。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 10:25