楼主: 大多数88
1234 21

[量化金融] 随机投资组合理论:机器学习的视角 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-11 07:19:46
我们更一般的设置允许任何一组交易特征。我们的框架中的交易机会是通过时间演变的交易特征xi(t)来揭示的,而投资图f完全决定了如何将这些机会化。因此,在我们的框架中学习一个投资策略相当于学习一个投资映射f。为此,我们考虑两个函数族。首先,根据PT的理论结果,我们考虑了X=R+是市场权重集的情况,并将f取为参数形式f:u7→ up,(16)表示p∈ R、 对应于多样性加权投资组合(DWP,见第2.4节)。其次,为了捕捉更复杂的交易模式,并允许更一般的交易特征集合X Rd,我们还考虑了另一种非参数方法,其中我们将logf设为具有协方差函数klog f的平均零高斯过程的路径~ GP(0,k(·,·))。(17) 为了学习“好”的投资地图,我们需要引入一个编码用户投资目标的非最优标准。为此,我们考虑一个性能函数PD,该函数将候选投资图的对数映射到投资组合πf(·)的历史性能PD(logf),如等式(15)所示,给定历史数据D。一个示例性能函数是年度夏普比率,定义为asSR(π)=√B^E({r(1),…,r(T)})^S({r(1),…,r(T)}),(18)其中r(T)=Pni=1ri(T)πfi(T)是我们的投资组合在时间T之间的回报- 时间t,ri(t)是时间t之间第i个资产的回报- 1和时间t,B代表一个业务年度的时间单位数(例如,如果每天都有收益,则为252),而^e(resp.^S)表示样本平均值(resp.样本标准偏差)。

12
nandehutu2022 在职认证  发表于 2022-5-11 07:19:50
性能函数的另一个例子是相对于基准投资组合π的超额回报*急诊室πf |π*=TYt=11+nXi=1ri(t)πfi(t)!-TYt=11+nXi=1ri(t)π*我(t)!。(19) PD(夏普比率、超额回报等)的性质取决于投资组合经理;我们没有理论上的限制。在参数情况下(等式(16)),PD(logf)是一个单变量p的有效函数,我们可以使用标准优化技术轻松地学习最优p。然而,在许多情况下,最好是在不确定性下进行推理,并采用贝叶斯方法。为此,我们通过似然模型p(D)表达了投资经理对什么是好业绩的看法log f),我们可以选择它作为PD(log f)L(PD(log f)):=p的概率分布D日志f. (20) 这可能是学习过程中最重要的一步。事实上,我们将在下一节中开发的贝叶斯方法旨在学习投资地图,在地图与训练数据之间提供适当的权衡,以及它与先验信念的一致性。如果“可能”图满足经理的投资目标样本,则这只会产生一个可预测的投资地图,反之亦然。如果一个人选择了可能性模型,使得可能的地图是赔钱的策略,那么我们的学习机器将学习赔钱的策略!幸运的是,可以非常直接地表示,likelyinvestment maps是与期望的投资目标相匹配的地图。例如,我们可以使用一个可能性模型,在给定一个候选投资图f的情况下,它的良好程度,或者相当于它“可能”成为我们感兴趣的学习策略的驱动函数的程度,与它在样本中生成的夏普比来自平均值为2.0、标准差为0.5的伽玛分布的程度相同。

13
kedemingshi 在职认证  发表于 2022-5-11 07:19:53
伽马分布的正支持使得导致样本中的负夏普比的函数不受关注,而夏普比在2.0左右的分布集中反映了我们的目标性能和它周围的一些公差。伽马均值(2.0)和标准差(0.5)的选择反映了投资经理的风险偏好,而尾部消失则恰当地反映了这样一个事实,即过高的绩效PD(log f)可能会引起怀疑,过低的绩效也不够好。为了完成我们的贝叶斯模型说明,在参数情况下,我们在p上放置一个统一的[-3.2推论在本文的其余部分,我们将使用相对于等权投资组合(EWP)的总超额-交易成本调整-回报(如(19)中所定义)作为性能函数,该等权投资组合具有恒定权重πEWPi(t)=n,i=1,NT≥ 0.(21)在整个训练周期内Pd(logf)=ER(πf | EWP)。(22)我们假设重新平衡后的交易成本为10个基点(即,每次交易的成本为名义成本的0.1%)。算法(执行)交易从业者都知道,一个好的经验法则是,当执行一个规模为流动股票平均日交易量(ADV)10%的订单时,预期支付10个基点。因此,只要投资于每只股票的财富不超过10%,这种假设是合理的。必要时,我们使用似然模型L(PD(logf))=γ(PD(logf);a、 b),(23)其中,我们用平均值a和标准偏差b表示伽马分布的概率密度函数。如前所述,a和b不需要学习,因为它们反映了投资经理的风险偏好。在下一节的实验中,我们使用a=7.0和B=0.5。

14
可人4 在职认证  发表于 2022-5-11 07:19:56
换言之,我们假设理想的投资策略应该是,从一个财富单位开始,培训期内的最终财富平均应比同一交易周期内同等权重的投资组合所获得的最终财富高出7.0个财富单位——这是故意贪婪的。频率参数:我们考虑的第一种推理方法是通过最大化p的PD(logf),直接学习DWP的最佳参数∈ [-8, 8]. 作为比较,SPTL文献中考虑的p的典型范围为[-1, 1]. 为了避免局部最大值出现任何问题,我们对网格大小为0.05的uniformgrid进行了蛮力最大化。贝叶斯参数:我们考虑的第二种推理方法包括使用Metropolis-Hastings算法(Hastings[1970])从DWP情况下指数p的后验分布p(p | D)中取样∝ L(PD(p))×1(p)∈ [-8,8]),(24)其中我们将L(PD(logf))重写为L(PD(p)),以使p中的依赖关系显式。我们对一个提议进行取样这在我们进行的每个实验中都不超过几秒钟。更新p*从以当前指数P为中心且标准偏差为0.5的高斯分布。很容易发现接受概率为ber=min1,L(PD(p*))L(PD(p))1(p*∈ [-8, 8]). (25)我们特别注意到,只要p在[-8,8],等式(24)中的指示函数不会对马尔可夫链造成问题。我们通常会运行10000次迭代,并将前5000次作为“老化”丢弃。我们使用从训练数据中学习到的后验平均指数,在相应的DWP^f(u)=uE(p|D)之后,在我们的测试范围内进行交易。(26)贝叶斯非参数推理:我们考虑的第三种推理方法是贝叶斯非参数推理。我们将aGaussian流程置于log flog f之前~ GP(0,k(·,·))。

15
nandehutu2022 在职认证  发表于 2022-5-11 07:20:00
(27)考虑到我们在实验中考虑的数据集的大小(超过300万个训练输入——25年内有500个资产),我们在笛卡尔网格上近似计算潜在函数。这一近似值与金融数据的量化性质非常吻合。我们使用有理二次(RQ)核函数k(x,y)=kdYi=1的可分离乘积作为协方差函数1+(x[i]- y[i])2αili-αi,(28),其中超参数k,li,αi>0,在此基础上可以推断出独立的对数正态先验。我们发现RQ核比高斯核更好,因为它允许“可变长度尺度”。通过f表示inputgrid上投资映射的值,我们更喜欢使用等效的白化表示Log f=LX,X~ N(0,I),(29)其中I是单位矩阵,K=[K(xi,xj)]I,j≤N个输入点上的Gram矩阵,K=UDUTis是K和l=UD的奇异值分解(SVD)。我们使用阻塞吉布斯取样器(Geman and Geman[1984])从后验点(对数X,对数k,{log li,对数αi}i)取样≤d | d)∝ L(PD(LX))×p(logx)p(logk)dYi=1p(logli)p(logαi),(30),其中我们将L(PD(logf))重写为L(PD(LX)),以强调可能性完全由f=LX定义。白色表示法有两个主要优点。首先,它对病态具有鲁棒性,因为我们可能总是计算L,即使K是单数。其次,它在函数值和超参数之间创建了一个硬链接,因此更新后者会影响可能性L(PD(logf)),因此直接有助于提高训练性能PD(logf):我们发现这有助于改善马尔可夫链。我们的阻塞Gibbs采样器在以超参数为条件更新log X和以log X为条件更新超参数(因此L)之间交替进行。对于这两个步骤,我们都使用光学切片采样算法(Murray et al。

16
能者818 在职认证  发表于 2022-5-11 07:20:02
[2010]).我们的采样器的计算瓶颈是K的奇异值分解(SVD)的计算,我们可以通过使用标准Kroneckertechniques(参见Saatchi[2011])技术利用内核的可分性和输入空间的网格结构来非常有效地进行计算。4实验我们在实验中考虑的股票宇宙是标准普尔500指数的组成部分,考虑指数成分的变化。我们每天重新平衡我们的投资组合。在每个交易日结束时,我们确定第二天的目标投资组合,该投资组合在下一个交易日开盘时获得。当指数的组成部分在t日发生变化时,我们的目标组合在t日结束时-1与indexon day t的组成部分有关(这确实是市场在day t已知的)- 1). 如前所述,我们假设每笔交易产生的费用为其名义价值的0.1%。我们使用的回报考虑了公司事件,如股息、违约、并购等。我们的数据来源是CRSP和Compustat数据库,我们使用1992年1月1日至2014年12月31日的数据。在我们的第一个实验中,我们的目的是说明,在广泛的市场条件下,我们在本文中提出的方法始终显著优于SPT替代方案。我们考虑使用连续10年的数据和接下来5年的测试,学习上一节所述的最佳投资策略。我们从1992年1月1日开始对FirstTraining数据集进行测试,并将培训和测试数据集滚动一年,这导致总共有9对培训和测试子集。

17
大多数88 在职认证  发表于 2022-5-11 07:20:06
我们比较了等权投资组合(EWP)、市场投资组合、多样性加权投资组合,其中指数p通过最大化估值函数(DWP*)学习,多样性加权投资组合中指数p通过MCMC(DWP)学习,高斯过程方法使用市场权重(CAP)的对数作为交易特征,高斯过程方法使用市场权重和资产回报率(CAP+ROA)的对数作为交易特征。第t天的资产回报率(ROA)定义为公司报告的最后一次净收入与公司报告的最后一次总资产在第t天的比率——我们注意到,该数量可能不会每天发生变化,但这不会影响我们的分析。使用ROA作为附加特征的理由是,不仅要了解一家公司有多大,还要了解它相对于其规模的表现。表1总结了年度样本内和样本外收益加上减去两个标准误差的9种情况下的平均值。可以看出,所有学习到的策略在样本内和样本外都优于基准(EWP)。此外,通过考虑非参数模型,即使考虑的唯一特征是市场权重,性能也会大大提高。在SPT框架内分析这些策略家族在数学上很难。最后,可以看出,增加更多的交易特征确实会增加价值。至关重要的是,无论是在样本内还是样本外,CAP+ROA组合都显著且持续地优于基准(EWP)。表1:我们的学习算法与不同市场条件的一致性的第一次实验结果。ISRET(分别为OOS RET)在样本中(分别为。

18
能者818 在职认证  发表于 2022-5-11 07:20:09
样本外)平均(在实验的9次运行中)年回报率为%±2个标准误差。投资组合为RET(%)OOS RET(%)市场8.56±1.626.23±2.07EWP 10.56±1.678.99±1.85DWP*11.94±2.0112.51±1.12DWP 11.91±1.9912.50±1.11CAP 26.54±2.3822.05±2.89CAP+ROA 56.18±7.3525.14±2.58在我们的第二个实验中,我们旨在说明我们的方法对金融危机是稳健的。为此,我们使用1992年1月1日至2005年12月31日的数据对我们的模型进行了训练,并在2006年1月1日至2014年12月31日(包括2008年的金融危机)期间对所学的策略进行了测试。我们比较了与以前相同的投资策略。图1显示了贝叶斯参数法中指数pin的后验分布。学习到的后验平均投资图如图3所示。在表2中,我们提供了样本内和样本外的平均年回报率以及样本外的夏普比率。再次,我们可以看到:i)所有LearnedPortfolization确实在样本内和样本外都优于基准(EWP),ii)非参数方法优于参数方法,以及iii)将ROA作为一个附加特征添加确实增加了价值。这些结论不仅在绝对值(收益率)上是正确的,而且在对风险(夏普比率)进行调整后也是正确的。我们的方法在2008年金融危机期间的表现,可以在图2中提供的总财富时间序列中看到更详细的说明。事实证明,ROADO不仅提高了样本的收益率,而且还具有“稳定效应”,因为财富过程的波动性大大降低。最后,值得强调的是,二维情况下学习投资图的形状(图3)表明,贝叶斯非参数方法揭示的投资策略很难用参数模型复制。

19
大多数88 在职认证  发表于 2022-5-11 07:20:13
再一次,在SPT框架内,无法得出与此类投资组合相关的分析结果。图1:在我们的第二个实验中,多样性加权投资组合参数p的后验分布。该模型在1992年1月1日至2005年12月31日期间接受了市场数据培训。表2:关于金融危机拟议方法稳健性的第二次实验结果。回报率(RET)是整个测试期间总回报率的年度等价物(单位%)。年化夏普拉蒂奥(SR)符合式(18)。IS(resp.OOS)代表样品内(resp.样品外)。投资组合为RET(%)OOS RET(%)OOS SRMARKET 9.60 7.90 0.47EWP 13.46 9.60 0.51DWP*14.62 11.74 0.56DWP 14.62 11.38 0.55CAP 16.49 18.01 0.60CAP+ROA 37.54 18.33 0.725结论与讨论随机投资组合理论(SPT)的逆问题如下:给定用户定义的投资组合seFigure 2:第二次实验中样本外财富过程的时间序列。模型在1992年1月1日至2005年12月31日期间接受市场数据培训,并在2006年1月1日至2014年12月31日期间接受测试。选择标准,一个人如何着手构建符合预期投资目标的合适投资策略?在SPT框架内解决这个问题极具挑战性。我们提出了SPT逆问题的第一个解决方案,并通过经验证明了所提出的方法始终如一且考虑周全,能够执行标准基准,并且对金融危机具有鲁棒性。与SPT框架不同,我们的方法完全基于历史数据,而不是随机演算。这使我们能够考虑一个非常广泛的候选投资策略类别,其中包括所有特殊目的交易策略,但关键是包含许多无法在特殊目的交易框架中分析的投资策略。

20
nandehutu2022 在职认证  发表于 2022-5-11 07:20:16
与PT框架不同,我们提出的方法几乎可以处理任何用户定义的投资目标,并且可以利用任意一组交易特征。PT框架几乎完全考虑使用完全基于市场权重的投资策略来超越市场投资组合。我们的经验表明,这种灵活性的增加使我们能够发现金融市场中更微妙的模式,从而大大提高了绩效。尽管我们模型中的高斯过程在网格上近似为分段常数,但在使用稀疏高斯过程(QuinoneroCandela和Rasmussen[2005])或弦高斯过程(Kom Samo和Roberts[2015b])等替代近似时,没有理论或实际障碍。我们的方法可以扩展到使用Kom Samo andRoberts[2015a]的非平稳通用核学习更微妙的模式。我们的工作也可以扩展到图3:在我们的第二个实验中,学习了CAPportfolio(顶部)和CAP+ROA投资组合(底部)的对数投资图。对于CAP投资组合,信用区间对应于±2个后验标准差。低做多做空投资策略(即允许卖空的策略)。最后,开发我们工作的在线扩展,捕捉市场动态的时间变化,这将是一件有趣的事情。感谢Yves Laurent感谢Oxford Man定量金融研究所的支持。Alexander感谢来自工程和物理科学研究委员会、野村和牛津曼定量金融研究所的博士生。沃顿研究数据服务公司(WRDS)被用于为本文准备数据。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 20:23