楼主: 何人来此
1019 45

[量化金融] 高绩效股指交易:有效利用深度 [推广有奖]

21
可人4 在职认证  发表于 2022-6-11 15:33:38
这些点可以选择为具有恒定值,或与D^r的特定百分位相对应,或以任何其他一致的方式对于Q确定的每个bin,使用2005年1月1日至2008年1月1日期间输入数据的历史记录和相应的模型预测,以确定因遵循Def的交易策略而导致的买卖事件。2、计算每个买卖周期的资产价格差异以及发生相应买入交易的每个仓位i的总和(等式10)。根据公式11,将分配Sai>1设置为其最佳值根据分配政策(Q,A),在随后的时间段(2008年1月2日至2009年12月31日)内,测试交易策略和ourLSTM模型所有变量在一系列超参数方面的可行性,再次根据前T个交易日的输入数据每天对网络进行训练,然后预测第二天的价格。选择产生最有利可图(而非最精确)模型的超参数值将所选模型应用于新数据样本(2010年4月1日至2018年1月5日),并评估其可行性。为了避免与用于进行预测的滚动训练测试程序混淆,我们将使用“样本外”一词(而非测试)。同样,用于构建初始分配策略和执行超参数选择的2005年1月1日至2009年12月31日期间将被称为示例。我们继续讨论每个步骤的重要细节和实际考虑因素。4.1.

22
大多数88 在职认证  发表于 2022-6-11 15:33:41
LSTM培训与其他研究(如Bao等人,2017)相比,其他研究使用了更传统的培训验证-测试框架,我们发现滚动培训测试窗口方法更适合。稳定性将简单地为g/C,其中g是净利润,如(9)中所计算,C是投资于我们环境的初始资本,其中每次t,该网络使用过去的数据进行训练,然后要求预测“明天”的价格(时间t+1)。通过在每个步骤更新模型权重,在进行预测之前使用最新信息,我们避免了培训和测试数据之间的“滞后”或“时间断开”(例如,如果我们的培训数据与我们被要求进行预测的时间相比,与过去相比“远”),并允许模型随着时间的推移更好地“反应”价格序列中的变化机制,从而使其更具可行性。正如我们在第。3.1,我们使用了序列到序列的培训模式,因为与序列到值的培训相比,它导致了显著的高累积回报。我们推测,要求网络预测一个时间间隔内的资产价格序列,结合使用该时间间隔内产生的所有隐藏向量,可以让网络了解价格序列中可能存在的潜在“微观结构”(例如趋势或其他短期特征),从而促进培训过程。使用时间反向传播(BPTT)和ADAM优化器对网络进行训练,ADAM优化器在python 3和Tensor Flow v1.8中实现。从均匀分布初始化网络权重(使用Glorot-Xavier均匀方法),并将LSTM单元状态初始化为零值。我们将指数衰减应用于我们的学习率,并训练了1600次迭代。

23
大多数88 在职认证  发表于 2022-6-11 15:33:44
通过使用均方损失函数观察训练和测试误差,选择迭代次数以避免过度拟合。需要注意的是,如上所述,滚动窗口训练过程使用了1的批量大小(即,每次在一个T大小的数据窗口xt上训练网络)。我们的数值实验表明,对于我们提出的体系结构,较大的批量并不能提高模型和交易策略的最终可靠性,有时甚至会导致性能降低。根据选项HyperParameters(在第4.3节中列出),在一台设备适中的计算机上(Intel i7 CPU和16 GB RAM),计算一个滚动窗口步长所需的时间介于7到30秒之间。4.2. 分配政策选择分配政策切入点(Q)的总数和值是在数值实验后确定的,以确保Q定义的所有仓位都包含足够的样本数量,并且数量充足,使我们能够在执行买入不同仓位时辨别交易策略实现的利益差异。我们发现,就最终的可操作性而言,一种有效的方法是使用绝对预期收益分布的百分位数来选择Q中的切点,例如,与批量大小为1的培训相比,批量大小为50的培训导致平均百分比误差增加一倍,累计收益减少15%,第5节给出了交易表现的详细信息。D | r |因此,Qcuto OFF设置为零(因此,根据定义2,如果我们的模型预测回报为负,我们将出售所有持有的股票),并再设置六个切入点Q。

24
nandehutu2022 在职认证  发表于 2022-6-11 15:33:47
选择Q对应于绝对预测收益分布的前六个十分位(10%、20%、30%、40%、50%和60%),将预测收益集分成八个箱子。对于每个bin,i,我们可以使用历史预测价格和实际价格来计算价格差异的总和(根据公式11),并确定最佳分配Ai。我们强调,上述关于Q的选择是实验的结果,Q中的元素原则上可以优化;然而,这样做并非微不足道,出于空间考虑,我们将不会在这里进行研究。在实践中,允许分配政策(Q,A)适应新数据而不是在相当长的时间内固定是有利的,因为预测和实现回报的分布不太可能是固定的。随着模型每天做出新的预测,我们有机会将新数据添加到预测收益的分布中,并调整Q中的切点。同样,随着交易策略产生新的买卖决策,我们可以重新计算分配a。这里有很多选择,例如,在一个不断增长的窗口中积累有关回报和交易决策的新信息,该窗口延伸到最早的可用数据,或者再次使用滚动窗口,以便每天向分布添加新数据时,删除“旧”数据。考虑到上述情况,我们选择在每个时间步更新Q中的百分位数,使用在第一次样本外预测之前120个时间步开始的数据增长窗口。例如,为了对2010年1月4日(样本期外的第一天)进行预测,模型在2009年7月15日至2010年1月1日之间的预测回报被纳入用于计算Q的经验分布中。

25
何人来此 在职认证  发表于 2022-6-11 15:33:50
这样做是为了避免最初没有用于计算Qi的数据(例如,在样本期外的第一天)的问题。120步“引导”期是在对几种备选方案进行试验后选择的,包括或多或少地使用预测收益的初始历史,或使用固定大小的滚动窗口来确定应该使用多少“过去”。关于分配,Ai,在计算公式11中价格差异的每仓位总和时,我们发现,在实践中,最好包括所有可用的买卖事件历史和相应的价格差异,直到我们的数据样本开始(2005年1月1日),即增加的可支持性。接下来,在每个时间步都会做出asbuy和sell决策,由此产生的价格差异包含在sumsof等式11中,并在必要时更新分配A。表1列出了一组仓位的实例、对应的切入点和每个仓位的价格差异总和(计算用于2010年4月1日样本期的第一个交易日)。

26
mingdashike22 在职认证  发表于 2022-6-11 15:33:53
例如如果标准普尔500指数在2010年1月4日的预计回报率在30-40%区间内(或者,相当于区间[0.65%,0.97%),我们不会购买任何资产(相应的分配设置为零),因为如果我们购买了,在我们出售资产时,资产中的预期价格差异将为负值。标准普尔500指数道琼斯指数2000年1月1日(十分位数)QiδiQiδiQiδiQiδi1:卖出0-0-0-0 2:0%-10%0.12%126.97 0.01%-1785.45 0.05% 62.37 0.01% 139.193: 10%-20% 0.38% 99.92 0.02% -1529.37 0.10% 520.54 0.03% 90.764: 20%-30% 0.65% 131.35 0.03% 904.60 0.12% 52.27 0.06% 23.195: 30%-40% 0.97% -66.71 0.04% -88.28 0.16% -59.84 0.07% 87.326: 40%-50% 1.18% 128.67 0.06% 1062.01 0.18% 206.65 0.10% 1.647: 50%-60% 1.44% -191.68 0.08%381.46 0.24%254.78 0.12%6.178:60%-100%-222.85-3850.18-719.68-248.96表1:预测收益率分布的每个仓位区间的切点快照Qi(以百分比报告)。QI标记每个bin的上限值,并使用模型从2009年7月15日至2010年4月1日的预测收益进行计算。δidenote在2005年1月1日至2010年4月1日期间,使用拟议交易策略时,对等式11中相应的价格差异总和进行了经验估计。如前所述,只有当预期回报率低于实际价格差异总和为正的bin时,购买Ai=Amaxunits才是最佳选择。在实践中,Amaxis的选择通常受到预算限制或投资授权的限制,这些限制了可购买的最大单元数。该最大值也可能与投资者的风险收益挂钩。在我们的研究中,Amax被设定为在交易期开始时可用资本可以购买的最大数量。

27
大多数88 在职认证  发表于 2022-6-11 15:33:56
例如,在2010年4月1日样本期开始时,标准普尔500指数的价格为1132.989美元,因此,如果我们的初始资本为28365美元,我们将Amax设为25。然而,从实际情况来看,由于股票指数不可直接交易,人们可以交易一只可用的交易所交易基金(ETF),ETF跟踪指数,被认为是投资指数最容易获得和最便宜的选择之一。因此,为了将我们的方法应用于标准普尔500指数,我们可以选择tradeSPY,这是一种跟踪该指数的流行ETF,并基于上述2010年4月1日94.55美元的初始资本和间谍价格,将Amax=300。在下一节详细介绍的实验中,我们将选择交易四只知名ETF,即标准普尔500指数的SPY、道琼斯工业平均指数的DIA、R2000指数的IWM和纳斯达克指数的OneQ。4.3. 超参数TuningA网格搜索方法用于选择我们的神经网络的参数,即STM层数、每LSTM层的单元数(H)、脱落参数(脱落仅应用于给定神经元的输入)和输入序列的长度T。由于我们的最终目标是盈利能力,这意味着评估我们模型在每个参数组合下的累积回报率,以确定最具盈利能力的变量(这可能因股票或股票指数低估而有所不同)。对于表2中列出的每个超参数选择,我们在2005年1月1日至2008年1月1日期间执行了上述滚动培训测试程序,并计算了初始分配策略(Q,A)。之后,我们使用2008年1月2日至2009年12月31日的数据,计算实现的参数范围。LSTM第2、3Nr层。

28
nandehutu2022 在职认证  发表于 2022-6-11 15:34:00
单位(H)32、64、128的输入序列长度(T)11、22、44的0,50,70%表2:超参数网格搜索值。通过应用我们的交易策略(如前一节所述,分配策略在每个交易日都在变化)。随后的这段时间包括505个交易日,包含了足够数量的滚动窗口和相应的预测,从中可以比较每种类型参数选择的性能。此外,它还涵盖了2009年的全球金融危机,并足以适应各种市场周期。因此,确定了导致四种感兴趣的股票指数中每种指数的累积回报率最高的模型参数,并在表3中列出。在一台小型6台机器上,标准普尔500指数道琼斯工业平均指数纳斯达克R2000Nr。LSTM第3 3 3 3 3Nr层。单位数(H)64 64 32 32输入序列长度(T)22 22 22 11丢失50%70%50%50%表3:网格搜索:最佳超参数值。96-CPU,96Gb RAM计算集群,整个网格搜索过程易于并行化。对于小型网络配置,例如长度为11的输入序列,使用2层和32个神经元,上述过程需要几分钟(≤ 5) 完成时长为44个输入序列的配置需要3天。5、结果在选择了一个超参数后,我们在样本期外(2010年4月1日至2018年1月5日)测试了结果模型和相关交易策略的性能(年化回报和其他利益衡量),我们为此预留了这段时间。

29
mingdashike22 在职认证  发表于 2022-6-11 15:34:03
总结上一节中概述的程序,在此期间,对于每个交易日t,我们通过在t输入数据的时间窗口上对其进行训练来更新LSTM网络的权重- Tt型- 1,目标输出为yt,然后使用窗口t上的输入数据计算第二天收盘价的预测,^yt+1- T+1,。。。,t、 接下来,我们确定了预测收益率,^rt=^yt+1/yt- 1和bin,i(基于Q中的百分位数),它位于其中。然后,我们购买或出售分配政策规定的资产单位数量(或指数情况下的相应ETF)(即,如果i>1,我们购买所有单位,如果i=1,我们出售所有单位)。如果执行购买,我们记录bin指数i和当时的资产价格。当该资产后来被出售时,从该交易中获得的利润(即,售价减去买价)被添加到等式11中的价格差异总额中,如果更新导致总额符号发生变化,我们重新计算相应的分配。最后,我们将^rtto纳入之前不断增长的预测收益集,并调整Q中的小数点,以考虑其新的分布,从而完成我们对分配政策(Q,A)的更新。我们将继续讨论以下主要结果:i)预测精度,以及ii)我们提出的方案在样本期外对所研究的每个股票指数的可行性。我们还将讨论与近期成果的比较,以及“天真”的预测方法和交易策略。5.1.

30
nandehutu2022 在职认证  发表于 2022-6-11 15:34:07
误差指标和预测绩效尽管我们的中心目标是实现良好的交易绩效,然而,我们将首先使用一些研究中经常引用的指标来评估我们提出的LSTM模型,这些指标涉及预测精度,包括平均方向精度(MDA),它以不太正式的术语衡量模型在预测股票价格运动的正确方向(上升/下降)、均方误差(MSE)、平均MDA=NPNt=11(符号(^yt)时的准确性- 年初至今-1) ·标志(yt- 年初至今-1) ,其中,如果x为正,则指标函数1(x)返回1,否则返回0,yt和^yt分别是时间t的已实现价格和预测价格,N是样本序列外的长度。MSE=NPNt=1(yt- ^yt)。绝对误差(MAE)、平均绝对百分比误差(MAPE)和相关系数(R)。表4显示了拟议的LSTM模型在同一样本外时期(2010年4月1日至2018年5月1日)对四个股指的预测性能。总的来说,我们的模型实现了低于1%的MAPE指标标准普尔500指数道琼斯指数纳斯达克R2000MDA 51.05%51%50.47%50.02%MAPE 0.66%0.6%0.8%0.9%MAE 11.07 95.33 30.8 9.01MSE 256 19047 1893 142R99.94%99.94%99.94%99.95%99.90%表4:LSTM模型的误差指标。所有指标的MDA均略高于50%。然而,将Pesaran Timmermann(PT)应用于预测的与实际的价格变动方向,并不能证明LSTM模型能够以统计显著的方式准确预测价格变动方向。标准普尔500指数、DIJA指数、纳斯达克指数和R2000指数的检验统计量和相应的p值分别为(PT=-3.61,p=0.999),(PT=-1.84,p=0.9674),(PT=-0.64,p=0.7378)和(PT=-2.03,p=0.9789)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 16:36