楼主: 能者818
1413 34

[量化金融] 人工智能改变自我:谁从机器人投资中受益? [推广有奖]

11
大多数88 在职认证  发表于 2022-6-24 07:54:41
考虑到许多投资者的交易频率,做空债券的吸引力较低,每月只有2 tr a des的中位数。机器人投资者的投资组合分配以固定的时间间隔进行,无论是每月、每季度还是每年。在本文的主体部分,我们专门关注季度业绩。3.1 AI Alter Ego我们构建了三种类型的A I Alter Ego机器人投资者。正如我们已经注意到的,每种设置只使用个人投资者在过去两年中的库存和电子交易,而不是整个股票领域。下表提供了两个示例。当我们提到t时,我们指的是年底,或月或月,取决于所考虑的情况。初始交易t-1 Trading t Investor Robo Investor holdings holdings potential holdings Stocks 1&2 Sells of 2 Buys stock 3 Stocks 1&3 Stocks 1,2&3 Stocks 1 Sells of 1 Buys ETF 4 ETF 4 stock 1&ETF 4 The First line描绘了投资者在t-2时持有两支股票,例如1和2(列称为初始持有)。在t-1期结束时,投资者出售所有持有的股票2,并在随后的t期结束时购买股票3。因此,在年底,她/他持有股票1和3。机器人投资者有股票1、2和3组成投资组合。第二种情况类似,但投资者只持有股票1,在t-1 a中出售所有股票,并在t中购买ETF 4。机器人投资者有两种资产可供选择。需要强调的是,机器人投资者可能持有现金,即决定不将所有资金投入股市。当讨论实证结果时,这将变得很重要。为了进行处理,我们需要引入一些符号。让Sitbe成为我在t之前的两年内持有的一组股票/ETF投资者。

12
何人来此 在职认证  发表于 2022-6-24 07:54:45
上述示例证明,这并不意味着投资者在年底/季度/月持有这些股票/ETF。这只意味着投资者在最近两年的历史中持有这些股票/ETF。我们用十分之一来表示投资者出现在D\'Hondt、De Winne、Ghysels和Raymond(2019)在线附录中的持续时间(月/季度/年,以适用者为准),报告了每月和详细的季度结果。年度结果可根据要求提供。在计算收益时,我们忽略了交易成本。由于我们的重点是季度交易频率,这是一个合理的抽象概念。可以说,每月的机器人投资者业绩更可能被夸大,因为交易成本没有计算在内。在样本中。此外,我们用Nit=#Sit表示集合中的股票/ETF数量。我们只考虑Nit的投资者≥ 2. t=1,Ti。这确保了投资机会集为机器人投资者提供了一套最低限度的股票/ETF。这使得我们有20622名投资者符合这一标准,并纳入了我们的分析。机器人投资者在t结束时购买,并在t+1结束前持有,即一个月、一年或一整年。然后,我们计算机器人投资者的生存期回报率raei,t+1,并计算无目标投资者的已实现收益率差为rsi,t=raei,t- ri,t。第一类使用DeMigu e l、Garlappi和Uppal(2007)的等权重规则对样本中的每个个人投资者进行阴影处理,第二类和第三类依赖于具有短期销售约束的均值-方差Markowitz(1952)策略。第二个和第三个变量之间的差异在于预期收益和风险估计的复杂程度。

13
何人来此 在职认证  发表于 2022-6-24 07:54:48
在第二种方法中,预期收益涉及一个简单的滚动样本估计量,第二个条件矩涉及Ledoit和Wolf(2004)的线性收缩估计量。在第三种情况下,使用机器学习和条件方差估计。更具体地说,对于条件平均值,我们使用弹性网、随机森林、神经网络和模型估计。对于条件c方差矩阵,我们使用Engle、Ledoit和Wolf(2019)从随机矩阵理论导出的非线性收缩方法来纠正样本特征值的样本偏差。我们赋予机器人投资者同等权重的是DeM iguel、Garlappi和Uppal(2007)1/Ni、tstrategy。特别是,对于每个个体i,另一个自我在时间t购买并持有集合中的所有股票,并以相等的分配1/Nit。此后,我们将此称为EW投资组合规则。滚动样本Markowitz将mea-n-方差最优投资组合构造为受卖空约束和个人投资机会集约束的最大夏普比率。我从股票的集合中选择投资者。最优投资组合的关键是对集合Sit中股票的条件预期收益(uit)和条件协方差矩阵(σit)的估计。机器人投资者为^wi解决问题,从这些股票中选择:maxwi、tw′i、tuit-γw′i,t∑itwi,twi,t≥ 0,其中γ通常被解释为风险规避参数,当其最大化夏普比率时,将其设置为1。我们使用两年滚动窗口历史平均值估算uit,uit=kPk-1j=0rdt-j、 式中,rdtis是日常收益的Nit×1向量,k是两年历史样本中的天数。

14
能者818 在职认证  发表于 2022-6-24 07:54:51
对于协方差,我们还使用了rollin g样本,在重新平衡期间,投资组合权重根据单个资产相对于整个投资组合的表现进行调整。特别是当t+1不是再平衡期时,wi,t+1=wi,t(1+ri,t+1)/[PNi=1wi,t(1+ri,t+1)]是线性收缩的估计器,如Ledoit和Wolf(2004)所述,基于相同时间跨度的每日收益。这些估计构成了我们天真的基准。机器学习和收缩继续马科维茨分配方案,我们探索滚动样本估计量的复杂性增加是否会转化为机器人投资者绩效的改善。我们假设每个投资者的另一个自我机器人投资者都可以使用一组通用的模型来替代滚动样本模式。对于预期回报预测,我们使用适用于1076项资产(683只股票和393只ETF)中每项资产的机器学习算法,并且Alter-Ego robo投资者选择与集合中股票相关的预测。更具体地说,对于条件平均值估计,我们使用弹性网(Zou a and Hastie(2005))、随机森林(Breiman(2001))、神经网络(Friedman、Hastie和Tibshirani,2016,第11章)和模型集合估计(Friedman、Hastie和Tibshirani,2016,第16章)。

15
mingdashike22 在职认证  发表于 2022-6-24 07:54:54
对于条件协方差矩阵,我们使用Engle、Ledoit和Wolf(2019)从随机矩阵理论推导出的非线性shr方法来校正样本e IGENV值的样本内偏差。3.2机器学习预期回报我们所考虑的情况是,机器人投资者依赖经纪公司内的建模部门,为他们提供整个股票/ETF领域的条件平均数和条件方差估计值,并向与每个个人投资者相关的另类投资者提供中股票的估计值uItan和∑It布景坐着。建模人员评估了广泛的模型类别,并使用样本外绩效指标来确定最合适的条件均值和条件协方差组合,以提供给therobo投资者。我们的目标是为这样一个经纪研究小组将要进行的全面条件建模过程提供一个简单的近似值。就预期回报模型而言,我们的分析分享了Gu、Kelly和Xiu(2018)也考虑的一些方法。为了进行分析,让ri,t-= (ri,t,···,ri,t-k+1′是股票i自身滞后股票重组的k×1向量。我们需要考虑N=1076只股票/ETF,T=110个月周期。我们使用70%的数据进行训练,20%的数据作为验证样本(用于超参数r调整),10%的样本用于测试样本外性能。

16
何人来此 在职认证  发表于 2022-6-24 07:54:57
为了最大限度地利用我们独特的数据集,我们从1993年1月至2002年12月开始使用returnsdata构建我们的模型——在我们的个人投资者数据开始之前的10年样本。我们使用五个Fama French月度因素(Mkt、SMB、HML、RMW、CMA)及其动量因素(参见Ken French网站的定义)以及Welch和Goyal(2007)预测因子(d iv.价格比、部门收益率、收益价格比、部门支付比、股票变化、BM DJ股票、净股本扩张、TBill、长期收益率、长期利差)来增加月度股票/ETF回报率,违约收益率利差,通货膨胀(有关定义,请参见他们的论文)。我们知道,一个真正的数据工程团队可能会创建一组更大、更可靠的数据源。我们的目标不是复制真正的数据源生成过程,而是为预测提供一组所有有用信号的简单近似值。让Xt表示这些预测因子的M×1向量。在每个模型类中,我们分别估计每个股票/ETF的单个模型,而不是将股票/ETF合并,以便在模型参数估计中尽可能多地考虑异质性。常用的模型elingobjective是估计Et[ri,t+1],其中Et[ri,t+1]=fi(zi,t)。因此,建模人员采用不同的方法来估计fi(),并努力确定最佳可能的协变量集zi,t。我们将条件平均模型分为(1)线性ar和(2)非线性模型集。在线性模型中,我们考虑OLS和弹性网络模型。对于非线性模型,我们考虑回归树和浅层前馈神经网络的EST的随机性。

17
能者818 在职认证  发表于 2022-6-24 07:55:00
因此,我们考虑了两种流行的非参数和参数机器学习模型,它们旨在引入协变量之间的非线性相互作用:回归树的随机dom森林(非参数)和人工神经网络(参数)。最后,我们考虑跨所有模型的简单模型集成。线性模型我们在时间段t=k,…,对每个股票i估计f的线性模型,T- 1的形式为:ri,t+1=βi,0+βi,rri,t+βi,xxt+i,t+1(1)。除了使用OLS估计该模型外,我们还使用弹性网络对每个股票i的线性模型集进行了优化,包括两个调整参数(α,λ)。Li(θ)=T- kTXt=1i,t+1+αλXm∈#β|βm |+(1- α) λXm∈#ββm(2)其中β=(βi,0βi,rβi,x)非线性模型我们考虑两种常见的无参数和参数机器学习模型,旨在引入协变量之间的非线性分量:回归树的随机林(非参数)和人工神经网络(参数)。我们使用(Breiman(2001))的算法来估计随机森林模型,并使用随机梯度下降来最小化lord e r中带正则化项的目标函数,用于训练神经网络。在这两种情况下,我们的评估技术都是标准的。我们再次根据训练数据估计模型,并在验证集上优化所有相应的调整参数。随机森林随机森林是单个回归树的组合。这是一种自举方法,旨在通过在给定树的一个分支上使用预测因子的

18
能者818 在职认证  发表于 2022-6-24 07:55:03
给定树的预测可以表示为:h(zi,t;β,K,L)=KXk=1βk1{zi,t∈ Pk(L)}(3),其中Pk(L)是第k个分区,它考虑了几乎L个不同的分支。给定分区的一组分支可以表示为连续分支的指标的乘积。对于给定分区,则^βkis是该给定分区所有成员的返回平均值。使用标准贪婪搜索算法最大化每次分割时获得的信息。递归二进制分割算法一直持续到满足一组停止标准,这通常取决于从分割中获得的最大附加信息小于阈值,或达到的最大树叶数和/或树的深度。对于随机森林模型,关键调整参数s是引导树的数量、每个树的深度以及在树内的每个潜在点处考虑的预测值的随机子集。然后,rando m forestprediction是树上任何预测点的自举平均值。神经网络我们的神经网络结构是两个隐层,每层有10个神经元,输入层和隐层有一个sigmoid传递函数,输出层有一个线性传递函数。我们使用随机梯度下降来最小化l具有正则化项的目标函数,用于训练神经网络。在这两种情况下,我们的估计技术都是标准的。我们再次根据训练数据估计模型,并在验证集上优化所有相应的调整参数。最后,我们考虑上述线性和非线性估计器的模型集合,将我们自己限制在预测预期回报的等权重方案中,以限制引入额外的估计不确定性。图1显示了一组10 bar plo t簇。

19
大多数88 在职认证  发表于 2022-6-24 07:55:07
每个都显示预测性能的年末(上一季度)快照。所显示的10个滚动样本,每个样本都与10年的回报数据样本有关,用于估计、验证和预测回报。对于10个滚动样本中的每一个,将显示竞争模型的相对表现(仅关注股票)。样本外表现以MSE衡量,每一条线的高度代表特定模型在预测样本中所有股票的回报横截面时具有最低MSE的百分比。对于每个集群,条带的高度总和为100%,每个代表特定类别的模型为683条横截面提供了最佳的回报预测。我们注意到,神经网络模型代表了最成功的模型类别,通常是横截面中40%到50%资产的最佳模型。紧随其后的是一类弹性Ne t模型。所有其他方法都不太成功,尽管随着时间的推移会有很大的变化。图1所示的结果可能会给人留下神经网络模型占主导地位的印象。让我们把注意力转向表1,它可能对这一结果有不同的解释。表1报告了所有资产和滚动样本方案的样本外预测的平均MSE和MAE。结果表明,当综合股票/ETF的表现时,弹性网络和神经网络模型的样本外MSE最低。然而,EN和NN之间的差异非常小,这表明虽然NN p erhaps提供了最好的预测,但EN通常是一个c lose second,可以说更容易实现。此外,EN是线性模型,而NNI是非线性模型。

20
大多数88 在职认证  发表于 2022-6-24 07:55:10
非线性的存在似乎没有实质性的回报。所有模型/估值器都有可以重新定义的维度,但最终建模小组会向机器人投资者提供一组股票/ETF的条件平均估值。每个选定的条件平均值估计都来自样本外MSE最低的模型。无需在股票/ETF中选择一个通用模型,事实上,我们可以看到,即使在少数情况下,包含所有协变量的OLS也是样本外绩效测试的模型。(^Et[ri,t+1])i的最终小组用于机器人投资者的最优投资组合问题。4实证结果实证结果侧重于回答以下几个问题:(a)更复杂的模型是否更好,(b)谁从rob o-advice中获益,(c)doe的robo投资在重大金融危机期间的表现如何,(d)人工智能如何与被动投资方案相比较,以及(e)利差是由于行为偏差造成的?有一小节专门回答这些问题。在本文的主体部分,我们报告了季度再平衡的一组总结结果。在线附录(D\'Hondt、De Winne、Ghysels和Raymond(2019))中报告了每月和详细的季度结果。4.1更复杂的模型是否更好?在表2中,我们为样本中的所有投资者报告了回报利差rsi横截面分布的中位数、第一个四分位数(Q1)和第三个四分位数(Q3),t=raei、t-ri、t,仅考虑股权持有量(左图)或683只股票和393只ETF(右图)。AI替代方案是:(a)具有滚动平均值/滚动方差的MV,(b)机器学习(ML)平均值/滚动方差-使用表1中的方法d,(c)ML平均值/非线性平滑方差,以及最终的等权重(EW)投资组合方案。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-8 01:18