楼主: 何人来此
1012 45

[量化金融] 高绩效股指交易:有效利用深度 [推广有奖]

11
可人4 在职认证  发表于 2022-6-11 15:33:07
(2016)提出了一种用于预测股价变动的神经网络,使用二进制输出来表示买入/持有或卖出交易建议。作者对输入时间序列进行去噪处理,然后将其输入神经网络。他们的模型在2010年1月1日至12月31日的一年期内应用于各种ETF,在交易成本之前,间谍的累计回报率达到41.89%,在允许卖空的情况下,回报率甚至更高。这种方法还提供了一个很好的例子,说明在交易单个资产时,很少有交易(一年14次)能够产生良好的业绩。年的工作(Zhong和Enke,2017)还利用60个输入特征和各种降维技术研究了标准普尔500指数的每日方向。研究期间为2003年6月1日至2013年5月31日。该研究中的最佳模型达到了58.1%的准确率,但同期“幼稚”或其他基线策略的准确率没有报道。使用购买标准普尔500指数或投资一个月期国库券的交易策略,在截至2013年5月31日的377天测试期内,日均回报率为0.1%,标准差为0.7%。最后,Ding等人(2015年)利用CNN对事件驱动的股市预测进行了一次有趣的尝试。其中提出的模型也会产生二元输出(即,预计股价会上涨或下跌)。在2013年2月22日至2013年11月21日的测试期间,使用定向交易策略,该方法被应用于标准普尔500指数的15只股票,报告的平均累积回报率为167.85%。SPY是一只跟踪标准普尔500指数的交易所交易基金(ETF)。需要注意的是,此处引用的几部作品报告了平均回报率(Bao等人,2017;Zhong和Enke,2017),但没有年度回报率或累积回报率。

12
能者818 在职认证  发表于 2022-6-11 15:33:10
不幸的是,算术平均回报率并不能提供实际资本增长/盈利能力方面的信息,因为它不能用来推断年度或累计回报率。此外,正如人们可能预期的那样,在不同的方法中很难宣布一个“赢家”:并非所有作者都报告相同的可支持性指标,评估周期也各不相同;即使与相同的资产和测试周期进行比较,如果测试周期很短(例如,一年,如Chiang et al.(2016)),也无法安全得出结论;Zhou等人(2019);钟安德科(2017);丁等人(2015年))。最后,还有大量关于机器学习方法和神经网络使用的工作,尤其是其中的目标是精确的价格预测,没有讨论该预测的进一步使用,无论是用于交易还是任何其他目的。代表性人物包括Lather等人(2015年);Chong等人(2017);Gu等人(2018年)。这一领域的研究量很大,但我们不会在这里深入研究,因为预测准确性本身并不是这项工作的重点。3、拟议模型和交易策略我们继续描述一个LSTM神经网络,该网络将用于预测股票或指数价格,然后是一个交易策略,该策略试图利用模型的预测,尽管预测准确,但很快就会变得精确。3.1. 网络架构我们提出的网络遵循流行的LSTM架构(Hochreiter和Schmidhuber,1997),通常用于递归神经网络应用(Russakovsky et al.,2015;Silver et al.,2017;Wuet al.,2016;Foster et al.,2018)。基本LSTM单元,如图。

13
何人来此 在职认证  发表于 2022-6-11 15:33:13
1,在每次t=0,1,2。。。长度为I的输入向量的B×I批次xt(其中B是批次大小,I是输入特征的数量),并利用多个乘法门来控制通过网络的信息流。除了通常的隐藏状态ht(大小为B×H,其中H是隐藏单元的数量)之外,LSTM单元还包括“内部”或“内存”状态ct,在本例中也是大小为B×H。输入(i)、输出(o)和遗忘(f)这三个门具有前馈和循环连接,它们接收输入xt,例如,如果我们在一项资产上投资1欧元,连续获得-99%、100%和100%的回报,我们的投资价值仅为4美分,即累计回报率为-96%,而平均回报率约为33%。图1:LSTM单元图(基于Olah(2018))。隐藏状态ht-1,生产=σ(xtWix+ht-1Wih+bi)(1)ot=σ(xtWox+ht-1Woh+bo)(2)ft=σ(xtWf x+ht-1Wf h+bf),(3)其中σ是sigmoid函数应用元素,偏差项b;大小分别为B×H和W˙,xandW˙,hare权重矩阵的维数分别为I×H和H×H。根据输入、输出和遗忘项(it、ot、ft-大小均为B×H),隐藏和内存状态的下一个实例计算为:^ht=xtWhx+ht-1 WHH+b^ht(4)ct=英尺 计算机断层扫描-1+it tanh(^ht)(5)ht=tanh(ct) ot,(6)其中 表示按元素乘法。输入门控制我们将要更新的内部状态的哪些元素,而忘记门确定将“消除”内部状态(ct)的哪些元素。在具有多个LSTM层的深层网络的情况下,每个层生成的隐藏状态被用作另一个Eqs实例描述的下一层的输入。(1) -(6),其中输入项xxtin等于。

14
何人来此 在职认证  发表于 2022-6-11 15:33:16
(1) -(4)替换为前一层的相应隐藏状态。我们网络的非滚动架构如图2所示。在操作上,网络接收σ(x)=1+exp(-x) 图2:length-T输入序列上“未滚动”LSTM架构(对于两个LSTM层)的高级概述。最后一个LSTM层的隐藏状态被收集、重塑并通过完全连接的层馈送,以产生所需的输出^y。数字向量序列(或其批次)xt-T+1。。。,xt,其中T是固定的“时间窗口”大小(出于我们的目的,T将在交易日内测量),并产生^yt的标量输出序列-T+2。。。,^yt+1在我们的上下文中,将代表股票或其他资产的预测价格。我们注意到,对于每个timet,输出序列中的感兴趣数量是其最后一个元素,^yt+1(即“下一个”时间段的预测价格),而之前的元素,^yt-T+2。。。,^yt,对应于价格的“预测”-T+2。。。,yt,在时间t时已经知道。虽然这些输出元素的包含可能看起来很复杂,但选择序列对序列的训练将有助于提高预测准确性和稳定性,我们将在后面看到。输入向量按顺序馈入LSTM单元,从而产生隐藏状态向量序列ht-T+1。。。,ht。这些反过来被用作下一个LSTMlayer的输入。最后一个LSTM层生成的隐藏状态向量(图2仅描绘了两个LSTM层,尽管其中一个可以引入其他层)通过线性完全连接层馈送,以生成输出序列。简而言之,我们有^y=hW^yh+b^y,(7),其中^y是(b·T)×O,O是输出维。

15
可人4 在职认证  发表于 2022-6-11 15:33:19
术语^y包含预测输出向量[^yt-T+2。。。,^yt+1]T,在我们的size-T窗口内,每次以size-B批次堆叠,h是隐藏状态向量ht的相似堆叠(B·T)×h矩阵-T+1。。。,由最后一个LSTM层(每个批次贡献T行)生成的Ht和W^yh,b^yar是权重矩阵和偏差向量,大小分别为H×O和(b·T)×O。就我们的目的而言,特征向量xt将包括资产的每日调整收盘价yt、开盘价y(O)t、日内低点y(L)t、日内高点y(H)t、收盘价y(C)t和前一天的调整收盘价yt-1,全部在线获得(YahooFinance,2018),即xt=[yt,y(O)t,y(L)t,y(H)t,y(C)t,yt-1].其余网络参数的特定选择(例如,隐藏状态数H和windowsize T)将在第节讨论。4.3.关于网络架构,我们想强调两种设计选择。一个是关于整个隐藏状态序列的使用,ht-T+1。。。,ht,由最后一个LSTMlayer在计算输出时生成。更典型的是,可以简单地让隐藏状态演化,而输入序列xt-T+1。。。,XT为“输入”,仅使用其“最后”值ht来计算预测值^yt+1。然而,这样做本质上意味着期望序列中存在的所有“有用”信息将被编码到最后一个隐藏状态。另一方面,利用整个隐藏状态序列将允许我们在滚动窗口中查找隐藏状态的时间演化信息,这将被证明是有益的,我们很快就会看到。第二个重要的设计选择是通过将隐藏状态向量重塑为(B·T)×H矩阵来处理隐藏状态向量,并根据等式7将其馈入单个完全连接的线性激活层。

16
能者818 在职认证  发表于 2022-6-11 15:33:22
这样,我们就避免了在每个时间步t使用一个完全连接的层- T+1。。。,t、 这将引入公式7的t“副本”,用于处理每个ht-T+1。。。,Ht分别进行调整,总共需要调整T×(H×O+B×O)权重。使用如上所述的单一致密层只需要H×O+B×T×O权重,随着窗口大小T的增长,这一数字明显降低。这种选择将允许我们以非常小的批量进行培训,这将直接导致培训时间缩短,同时利用隐藏状态的时间历史中的信息,并且还将使我们的方法适用于多资产设置或需要频繁培训的情况,例如在日常交易中。3.2. 我们在Sec中提到的交易策略和分配。2、根据预测模型的方向准确性做出交易决策是很常见的,即使该模型经过训练以获得较低的均方误差或绝对误差。也就是说,购买或出售的决定取决于模型是否预测下一个时间间隔内资产价格的上升或下降。在这里,我们与之前的方法不同,我们利用了这样一个事实,即对发生的事件几乎“不可知”,即资产价格变动的方向(上升/下降),并且能够收集关于atrade在特定事件条件下的可操作性的重要信息。在我们的例子中,事件将与预测在其自身分布中的相对位置有关。为了让事情更加精确,我们首先定义了分配政策和交易策略的概念:定义1(分配政策)。设M是一个预测模型,该模型在每次t时产生资产未来价值的估计值,即yt+1,后者由一些潜在的随机过程产生。

17
kedemingshi 在职认证  发表于 2022-6-11 15:33:25
设^rt=^yt+1/yt- 1是模型在时间t的一步预测收益率和D^rtheir分布。n-bin分配策略是一对(Q,a),其中Q∈ 注册护士-1是D^rin递增顺序的百分位向量,a∈ {R∪ }资产单位分配的na向量(例如,要购买的股份数量),其中 表示持有的所有资产单位的资产。定义2(交易策略)。给定预测模型M、当前资产价格yt和n-binallocation策略(Q,a),我们提出的交易策略包括以下步骤,在每个时间t执行:o在下一个时间步骤t+1中查询M以获取资产的预测回报率^rti。o莱蒂=1 if^rt<Qj+1 if^rt∈ [Qj,Qj+1),n如果^rt≥ Qn公司-1.o如果Ai>0,而我们目前没有持有任何资产,请购买资产的Aiunits。如果Ai>0且我们已经持有部分资产,或者如果Ai=0,则什么也不做。o如果Ai=, 出售所持资产的任何和所有单位。在我们的例子中,模型M将是上一节中描述的LSTM网络。直观地说,Q中的百分位数将实线划分为n个“bin”,交易策略是,只要预测收益位于bin i,并且我们还没有拥有资产,就购买资产的所有单位。为简单起见,我们将考虑Q=0和A=, Ai>1≥ 0,也就是说,如果下一个交易日的预期回报为负,我们总是出售所有资产,这是wesell唯一关注的事件。

18
nandehutu2022 在职认证  发表于 2022-6-11 15:33:28
当然,我们可以设想上述策略的变化,包括负配置值响应“卖空”(即,出售一部分有义务在以后回购的资产,预期其价值会下降),分配“卖出信号”,, 根据Q确定的不止一个BIN,使用投资组合中可用现金的随时间变化的AIDE值,或以货币金额而非资产单位衡量分配。其中一些选项本身值得探索,但出于空间考虑,我们将仅限于前面描述的设置。备注:我们注意到,拟议的交易政策可被视为经典定向“上下”交易策略的推广。如果我们将Q设置为0,即我们只使用一个分离点=[, 1] 那么只有两个仓位,一个用于正预测收益(在这种情况下,我们购买1套资产),一个用于负预测收益(在这种情况下,我们出售),这正是定向策略的工作方式。3.2.1. 优化分配政策根据上述定义,我们现在可以考虑在遵循Def交易策略的同时,对于给定预测模型,什么样的分配政策是最优的。2、当我们模型的预测收益率位于bin i>1时,我们将购买资产Ai的一些单位,然后将持有这些单位,直到预测收益率在bin 1之内。随着时间的推移,该过程生成一组持有区间,Ii j=[τi j+1,ωi j],其中τi j表示第j次买入交易的时间,而预测收益率在i>1之内,ωi j表示后续卖出交易的时间(即,在τi j之后的第一次,预测收益率在bin 1之内)。从Def中应清晰可见。

19
能者818 在职认证  发表于 2022-6-11 15:33:31
2间隔Ii j将是不重叠的(因为我们在已经持有资产的情况下从不执行买入),并且它们的结合将是我们持有非零金额资产的整个时间集。我们的分配政策风险为每次购买资产的Aiunits所需的货币金额Ai·yτi j。因此,在持有间隔Ii j结束时(即在一个单一的买卖周期之后),风险金额产生的净利润为Ai(yωi j- yτi j)。(8) 随着时间的推移,将有许多实例Ni,即资产在bin i时购买,M=PNibuy sell交易后的总净利润将beG=nXi=2AiNiXj=1(yωi j- yτi j),(9)导致预期净利润e{G}=nXi=2AiENiXj=1(yωi j- yτi j). (10) 等式10中的预期条款表示每个bin的隐藏区间内资产价格差异的预期总和,即当预期回报在每个特定bin内并遵循拟定的交易策略时,以购买为条件的资产价格的预期总上涨(或下跌)。从等式中可以清楚地看出。10如果在相关预期期限为负时,将每个分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配分配。假设我们每次能够或愿意购买的资产单位数量有一个实际上限,即Amax,那么最优配置值为thusAi>1=Amaxif EnPNij=1(yωi j- yτi j)o>0,0,否则。(11) 在实践中,公式11中的期望项将根据样本数据进行经验近似,因此它们的符号可能会被错误估计,尤其是当它们恰好接近于零时。出于这个原因,人们可能希望稍微改变Eq。

20
可人4 在职认证  发表于 2022-6-11 15:33:35
11因此,当预期的价格差异总和大于某个小阈值时,我们购买Amax > 0,以减少“赌输箱子”的几率。最后,我们注意到,为了简单起见,我们将Amaxto设为常数(跨时间和跨箱子i),尽管我们前面提到过,也可以有其他选择。4、模型培训和分配政策选择正如我们所看到的,上一节所述的最优分配和交易策略的规定要求我们的LSMModel产生的预测收益的(经验)分布。也就是说,我们需要一个经过训练的模型,以获得Q中的百分位数和它们诱导的“仓位”的具体值,以及每个仓位的价格差异的估计总和,这些差异将决定等式11中的分配a。我们的方法的逐步总结如下:o在大小为T的滚动窗口上训练和测试LSTM网络,其中对于2005年1月1日至2008年1月1日期间的每个交易日T,首先使用最近的价格数据调整网络的权重,(即输入[xt-Txt公司-1] ,和输出目标[yt-T+1,yt));然后,给出网络[xt-T+1,xt]作为输入,并要求提前预测价格序列,[^yt-T+2,^yt+1],我们从中保留第二天调整后的收盘价^yt+1,并计算预测收益率,^rt.o使用滚动窗口过程生成的预测收益分布D^来确定切割点向量Q。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-5 09:51