楼主: 大多数88
1047 33

[量化金融] 基于滞后相关的方向趋势变化深度学习 [推广有奖]

11
可人4 在职认证  发表于 2022-6-11 05:10:30
其余的库存(共56个)被丢弃,因为进一步的重建过程会使数据集因过多的重建插入而损坏。为了在缺少行的情况下获得完美的对齐,我们设计了一种针对速度优化的算法,该算法可对两个组合的日期-时间向量进行运算;一个来自不间断的时间线,一个来自每个股票矩阵,数据集被拆分为一个矩阵列表,其中一个列表位置为perRIC。对于每个列表位置,都会对矩阵进行调整,以通过追加行避免较高的计算成本。在理想和实际时间-日期向量之间的每次差异处,将所反映矩阵中的原始矩阵下移一位,用下一个相邻值替换缺失的行,并插入缺失的日期-时间戳。由于该过程在原始数据的细粒度水平上运行,仅替换很少的缺失值,例如,对于股市开盘后的初始公共服务和感恩节早些时候的市场收盘,较大时间间隔内趋势特征的结果可以忽略不计。最后,在最后一个日期时间戳的第一次出现时切割每个矩阵,只保留每个股票的价格信息。利用这些信息,利用方程式(2)中的简单线性回归,计算每个交易日和股票的价格趋势近似值。这就为方程(3)中449只股票的特征矩阵B留下了1241个观测值,对其执行方程(4)中的指数平滑。4.2. 用例实验设置图1所示的实验设置确保实验测试时间序列之间的时移相关性,而不是使用股票自身的历史信息,即预测股票的数据不是模型输入的一部分。

12
mingdashike22 在职认证  发表于 2022-6-11 05:10:33
这是基于时间序列的股票市场预测相关工作的主要差异之一,例如Takeuchi和Lee(2013),其准确度作为衡量相关性的指标。另一个不同之处是使用了更多的短期预测,即每天而不是每月的预测。由于我们的目标是发现股票之间的时不变相关性,因此使用五倍交叉验证和提前终止验证集来减少结果的可变性,并以节俭的方式使用数据(Seni和Elder,2010)。图1:梯度计算和深度分类模型过程的示意图。对于每个时间序列,通过在预先确定的时间窗口上进行简单线性回归来计算每个时间间隔的强度近似值,然后提取其梯度,形成时间间隔的梯度向量(β1,1,β1,2,…,β1,n),作为特征矩阵的一列。后者用于训练一个深度前馈神经网络,用于方向趋势变化的二元预测。这样,每个折叠和库存使用60-20-20的训练、验证和测试集。在进行交叉验证时,一个中心问题是选择正确的分割比率。60-20-20分割是机器学习中经常使用的经验法则,除了训练集和测试集之外,还需要验证集。关于较大的训练集,我们希望确保训练集中有足够多的数据点,以使模型能够高效地学习。

13
能者818 在职认证  发表于 2022-6-11 05:10:37
相反,如果验证集太小,则无法使用代表性样本正确评估学习参数的验证,而测试集的不足则会导致对看不见数据的最终测试具有相似性和非代表性。从数据集中拆分的训练示例使用最小-最大缩放按元素进行归一化。如前所述,指数平滑应用于所有三个集合的输入特征。我们将每个股票作为各自的目标重复这些实验,输入中没有关于股票本身的过去信息。输出向量采用一个热表示的形式,以指示梯度是大于还是小于前一个间隔。根据Takeuchi和Lee(2013)以及Ding等人(2015)的结果,选择了两个输出节点,而不是一个,以支持这种设置,并简化结构可比性。初步测试运行了20个随机选择的库存,以避免为使用酪蛋白选择超参数,结果显示,对于400个节点或隐藏层,测试集误差最小,以50个节点为增量测量,最多800个节点。用于实验的最终模型具有10个隐藏层,这个数字是从一个隐藏层开始,然后添加4个隐藏层来确定的- n的n个隐藏层∈ {0,1,2,3},如果性能仍在提高,可以选择添加更多的单层。随着性能的提高,添加了九个额外的隐藏层,此时的性能得到了提升。早期停止和“正则化”用于防止过度拟合和不必要的复杂性,而动量用于防止随机梯度下降终止于小间距的局部极小值。

14
可人4 在职认证  发表于 2022-6-11 05:10:40
辍学是防止神经网络过度匹配的另一种流行方法,也是深度学习中的一种流行技术(Hinton等人,2012年;Srivastavaet al.,2014年)。然而,对不同水平的任务进行的初步实验确实阻止了模型的学习,这可以归因于股票市场信息中的噪音水平非常高。基于历元的学习速率衰减用于沿优化器的下降路径找到最小值,学习速率ν、衰减系数δ和epochnumber e:ue=ue-1·1+δ·e(5)双曲正切函数作为激活函数,输出层为sigmoid函数。前一种选择是为了对抗权重饱和,而后一种函数是在softmaxfunction之上选择的,因为结果作为独立概率的可解释性,并且因为这些结果不需要积分为1作为后续方法的输入。该模型的权重初始化为零均值高斯分布的缩放样本,以解决梯度消失或爆炸的可能性,方差fnland初始偏差为0,nl表示第n层中的连接数,允许轻松适应未来使用直线的实验(Glorot和Bengio,2010;He et al.,2015)。4.3. 准确性和验证措施对于每个模型中的每个股票和折叠,除了预测之外,还针对正确的目标创建和测试预测的随机简化副本,从而生成分布与实际预测相同的模拟预测。

15
能者818 在职认证  发表于 2022-6-11 05:10:43
此副本可用于测试模型是否只学习了训练集中两个输出类的分布,这将导致与正确目标相比,实际预测和模拟预测的精度非常相似。另一个必须排除的情况是amodel学习预测训练集的主导类。为每个股票和模型创建两个目标,每个目标只包含两个类中的一个。如果一个模型从其各自的输入中学习到的可操作信息比训练集中的主要类别多,那么该模型需要在测试集上比这两个单一类别的模拟目标表现得更好,并与正确的目标进行直接比较。第四个验证度量是通过取每个时间步的所有三个度量的最大精度来计算的,确保在偏离50:50分布的情况下,每个时间步达到至少50%精度的基线。由于使用精度作为选择的指标可能会导致有问题的结果,我们随机抽取了50个数据集的股票,并对其进行精度和接收器工作特性曲线下面积(AUC)的评估,后者是歪斜类分布的公认指标(Bradley,1997)。虽然我们工作中的类是平衡的,但本练习验证了度量的选择,并说明了在处理分类问题时考虑类分布的必要性。该子类股票的准确率为55.284%,而AUC得分为0.55278。使用额外的十进制数的必要性表明,对于本文中使用的平衡良好的类,这两个度量指标是相似的。

16
可人4 在职认证  发表于 2022-6-11 05:10:45
此外,线性支持向量分类器(SVC)用于基于samegradient的数据,以便与simplerach方法进行比较。所有股票的平均准确度作为评估模型预测能力的标准方法给出。然而,这些准确度并不表明预测的变化是否太大而不能被视为成功,也就是说,模型的波动性是否增长过大。因此,我们还提供了三个基线模拟预测的准确度。此外,通过上尾试验计算每个基线和额外基线的预测精度P值,该基线包含每个库存(即每个模型)三条基线中的最高精度。每种情况下的无效假设是,预测的准确度并不显著大于相应的基线,α=0.001的显著性水平非常严格。最后,凹口方框图是一种常用的描述性统计可视化工具,使用各自数据的四分位数进行直观表示。两个框的非重叠缺口表示95%置信度下的统计显著中值差异。韦尔奇的t检验用于提高不等方差的可靠性。为了排除一种更简单的解释,即只有很少的观察结果能够有效识别一般的市场行为,并解决仅使用最新数据预测未来趋势变化的准确性不比交叉验证更高的可能性(交叉验证也考虑了未来的观察结果),进行了另一个实验:对20只随机抽样的非重复性股票,N是整个数据集的大小,对于初步实验,在第一次观察时,首先对神经网络模型进行完全训练。

17
何人来此 在职认证  发表于 2022-6-11 05:10:48
然后,对于l=2到(N- 1) ,通过对观察值1到l进行3个时期的训练(作为训练集),对模型进行迭代更新,同时对观察值1+1到N进行测试(作为测试集)。这个过程可以可视化为沿着数据集滑动一条分割线,在不断增加的训练集上训练,同时减少测试集。必须记住最后一点,因为小测试集不能很好地表示数据。因此,当只有10%的观察值仍保留在测试集中以仍提供可行估计值时,所述程序停止。4.4. 实验结果必须谨慎看待p值的使用,近年来对其经常不正确使用的批评有所上升。2016年,美国统计协会发布了一份关于p值广泛滥用的官方警告(Wasserstein和Lazar,2016)。因此,p值是结合其他度量给出的,例如平均值偏差的下边界给定99.9%的置信区间,中间差和四分位分布的凹口方框图,以及模型和基线的精度。图2显示了表1中所列的准确率为58.10%,明显高于所有基线,均为p值测量的平均值和方框图所示的中值,缺口和方框均不重叠。然而,与基线相比,模型的第一和第三个四分位数分布更广,SVC除外。

18
kedemingshi 在职认证  发表于 2022-6-11 05:10:51
表1给出了模型、不同基线和简单线性支持向量分类的精度,以及99.9%置信区间的平均值和最小差异的p值结果。虽然这项工作的重点是滞后相关性的存在和利用,但人们可能会想,目标股票信息的遗漏会产生什么影响图2:统计验证和准确性。a部分显示结果的匹配方框图表示。非重叠凹口表示95%置信度的中位数存在统计上的显著差异,所有基线都是如此。在这里,第1类是预测股票趋势将向下变化,而第2类是指向上变化。预测表示模型的性能,svc显示支持向量分类器(SCV)的箱线图,随机是与实际预测分布相同的随机预测的性能,最佳值表示每个时间步基线中的最佳结果。b部分展示了平均精度的直观可视化。蓝线代表模型的预测,红线代表SVC的预测,而仅预测向上变化或向下变化分别以浅蓝色和绿色绘制。Fulvous表示随机向量,其类别分布与模型的预测相同。模型结果和随机预测的平均值绘制为相同颜色的线。预测模型rand的准确性。1级2级最佳SVC0.5810 0.5002 0.4955 0.5045 0.5092 0.5474精度模型方差rand。SVC6.12e的1级2级最佳-41.43e-45.93e-55.93e-54.50e-510.87e-4根据基线和进行测试。1级2级SVCp值的最佳值<1e-3<1e-3<1e-3<1e-3<1e-3分钟。差异。0.0767 0.0816 0.0727 0.0679 0.0276表1:精度、方差和基线比较。

19
可人4 在职认证  发表于 2022-6-11 05:10:54
模型预测(model)的准确度和方差,以及所有基线中的最佳结果(best of),具有相同类别分布(rand)的随机基线,提供了支持向量分类(SVC)的比较结果和一个类的预测结果。第1类表示股票上涨趋势变化,第2类表示股票下跌趋势变化。提供p值和最小差值,以与所选基线进行比较。每个股票运行的输入对结果有影响。为了回答这个问题,我们重复上述实验,输入中包含这些信息。如果不包含此信息,则报告的结果为58.10%,如果包含目标股票的信息,则报告的结果为58.54%。虽然这表明股票的价格行为提供了额外的信息,但这一结果证明了该模型能够从目标股票和其他股票之间的滞后相关性中推断出大部分相关信息。正如精度和验证措施讨论中所述,前馈神经网络在第一次观察时进行训练,然后在数据集上进行3个时期的重新训练,该数据集由前一个时间步扩展,用于剩余时间步的预测。对20只随机选择的股票重复此过程,然后对预测结果进行平均。这一过程一直持续到90%的数据集被用作训练集,以便允许少量观察结果保留为测试集。由于预期结果的稳健性是需要考虑的一个重要因素,因此留下足够多的时间步长作为测试至关重要。

20
mingdashike22 在职认证  发表于 2022-6-11 05:10:57
如果从测试转移到训练集的过程会因测试集中只剩下一个库存而变得极端,那么结果将基于非代表性的时间步数。从金融市场稳健性的角度来看,该实验的设置允许评估模型在多年内的表现,从而评估随时间变化的市场条件。为了在实验结束时测量模型的精度,采用了最后100个时间步长的平均值,平均精度为60.23%。值得注意的是,这一结果优于之前使用交叉验证的实验,这表明在将要分类的相应测试示例之前完全从数据中学习,而不是使用测试示例之前和之后的训练示例来提取时不变的市场动态。在股票市场的框架内,对这一观察结果的一种解释是,金融市场中的滞后趋势相关性特征信息可用于预测滞后效应发生的未来,但在较小程度上可用于预测过去的观察结果。在这种情况下,学习到的信息在时间内是本地的,与针对过去数据进行的培训以及在线更新以适应新信息相比,交叉验证的效果较差。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 02:39