楼主: 何人来此
1007 14

[量化金融] 基于深度学习的金融趋势预测特征约简研究 [推广有奖]

11
能者818 在职认证  发表于 2022-5-31 08:25:53
为了研究这一方面,我们首先只考虑通过交叉不同的较慢和较快移动平均线(MA)获得的交叉指标。特别是,我们考虑了11个更快的MAs(所有周期都在[5,15]范围内)和11个较慢的MAs(周期在[20,30]范围内)。这导致通过不同的MAs组合获得121个指标。在表II和图5中,我们报告了使用不同数量的隐神经元对AE和RBM获得的准确度。AE和RBM的性能都是可比的,并且通过增加隐藏的神经元数量,性能会有所提高。表II以线性化交叉为输入特征的预测准确率嵌入神经元AE RBM1的数量65.04%65.27%3 67.06%68.23%5 67.23%68.57%10 69.29%69.3%15 69.74%69.79%25 70.53%70.36%40 70.86%70.02%50 71.19%70.41%60 71.36%70.41%70 72.15%70.53%80 72.26%70.41%90 72.54%70.08%100 72.26%70.69%110 72.36%70.08%所有69.69%在这种情况下,指标直接提供给SVM分类1 3 5 10 15 25 40 50 60 70 80 90 100 110隐藏神经元数量准确性(%)AERBMG。5、以线性化交叉作为输入特征的预测精度。获得的准确度值较低,且大量神经元的改善速度较慢,这表明多样性可能起到相关作用。事实上,当来源高度相关时,即使大量特征也可能传递很少的信息。在表III中,我们报告了使用整套可用指标获得的准确度。其中一些指标是关于回溯期的参数。对于那些我们假设不同的周期,即n=3、14、30,目的是丰富可用信息。我们还包括该指数的调整后收盘价和成交量。这导致共收集了93个源,每个源提供了特定的逐日功能。

12
kedemingshi 在职认证  发表于 2022-5-31 08:25:56
通过loo king对结果的观察,我们可以观察到准确性的实质性提高,以及对NAE和RBM的初步区分。表III以线性化指标作为输入特征的预测准确率隐藏神经元AE RBM1的数量61.98%62.22%3 69.87%71.43%5 71.54%72.5%10 75.4%73.62%15 76.61%74.02%25 79.49%73.33%30 82.03%73.61%40 80.99%73.56%50 81.74%73.73%60 81.74%73.56%70 81.92%73.62%80 81.74%73.21%90 81.62%73.44%72.40%1 3 5 10 15 25 30 40 50 60 70 80 90隐藏神经元数量准确性(%)AERBMG。6、以线性化指标作为输入特征的预测精度。缩放比例。AE和RBM需要缩放输入值。这通常是通过标准的最大/最小归一化来完成的。但是,还有其他可能性。在这里,我们考虑了通过经验累积分布函数(ECDF)获得的单位区间[0,1]的标度。该过程包括计算每个单独特征的ECDF,然后将其对应的ECDF值分配给每个时刻。期望最大/最小标准化保持数据点的密度不变,因此信息不会均匀分布在1 3 5 10 15 30 40 50 60 70 80 90个隐藏神经元的精确度(%)上。通过自身分布的ECDF衡量指标的预测精度。单位时间间隔。相反,ECDF提供的扩展能够更好地分布数据点,这可能有助于提高性能。表IV和图。

13
mingdashike22 在职认证  发表于 2022-5-31 08:26:01
7显示本实验的结果。准确度显示了实际的改善,支持了初始假设,即ECDF提供了更好的标度和标准归一化。表IV通过自身分布的CDF来衡量指标的预测准确率AE RBM1隐藏神经元数量61.98%62.56%3 70.04%72.11%5 73.16%72.75%10 78.11%75.51%15 78.4%74.82%25 83.64%77.02%30 85.54%76.32%40 86.18%76.49%50 86.75%75.92%60 84.85%76.15%70 85.88%75.98%80 84.97%76.79%90 85.42%76.05%44%E.AE Vs.RB M从以上所有实验中我们可以观察到如何存在一个最佳数量的隐藏神经元,在此基础上,性能不会改善或略有下降。这是AEM和RBM执行嵌入的最佳维度。一般来说,根据我们的经验,AE能够达到更高的维度。这可能是基于AE的特征约简提供更好性能的原因。为了验证这一发现,我们使用10倍cro-ss验证程序,在最佳情况下比较了两个网络(50个隐藏神经元用于AE,25个隐藏神经元用于RBM,所有指标都用作输入,通过ECDF的平均值重新缩放)。在表V中,我们报告了结果。他们概述了AE与RBM的一致表现,从而使AE更准确,训练更快。表V使用k-F OldAccurance训练时间k AE RBM AE RBM1获得的预测精度和训练时间86.75%77.02%16.59秒187.16秒85.83%76.73%16.63秒189.09秒85.6%76.09%15.69秒188.38秒85.25%75.57%16.27秒186.62秒85.77%75.63%15.98秒185.5秒85.02%75.34%17.16秒184.14秒86.06%75.51%17.29秒186.75秒86 17%76.09%16.16秒184.81秒9 86.23%76.04%17.69秒183.36秒10 85.66%76.4%16.25秒183.94秒IV。结论和未来工作财务预测问题通常涉及具有复杂数据交互的大型数据集。

14
大多数88 在职认证  发表于 2022-5-31 08:26:05
DL可以检测和利用这些内在非线性的相互作用,至少目前无法用任何现有的金融经济理论建模。一种方法是通过机器学习在降维特征空间中识别底层几何流形。在本文中,我们研究了自动编码器和严格的Boltzmann机器的应用,与PCA等线性方法相比,它们能够更好地完成这项任务。从趋势预测的准确性方面对两种方法进行了比较。实验表明,输入数据的初步预处理起着重要作用。特别是,考虑到频率分布,应在单位间隔[0,1]上重新映射值。相对于简单的最大/米归一化,这提高了精确度。此外,输入源的多样性也是至关重要的。在体系结构方面,AE的性能通常优于RBM,其训练时间也更短。两者都显示了一个异常的神经元数量,低于此值的特征约简由于模型不足而表现不佳,超过此值的特征约简由于过度拟合而表现不佳。在AE的情况下,嵌入神经元的最佳基数较大,这可以解释为什么性能更好,因为AE能够在输入数据中学习更高维度的结构。在这两种体系结构中,自适应学习率非常适合提高。迄今为止获得的实验结果是初步的,还有许多问题有待解决。其中,如果使用一个stakedAE,即由多个隐藏层组成,可能会导致攻击。参考文献【1】J.P.Cunningham和Z.Ghahramani,“线性降维:调查、见解和概括”,J.Mach。学Res.,第16卷,第1期,第2859-2900页,2015年1月。[2] G.E.Hinton和R.R。

15
kedemingshi 在职认证  发表于 2022-5-31 08:26:09
Salakhutdinov,“使用神经网络降低数据的维数”,《科学》,第313卷,第5786号,第504–507页,2006年7月。[3] S.H.X。Cai和X.Lin,“使用受限Boltzmann机器进行股票价格预测的特征提取”,摘自IEEE国际计算机科学与自动化工程会议(CSAE),第3卷,2012年5月,第80–83页。[4] C.Cortes和V.Vapnik,“支持向量网络”,马赫。学第20卷,第3期,第273-2971995年9月。[5] Y.B.Vincent Pascal、Hugo Larochelle和P.-A.Manzagol,“使用去噪自动编码器提取和合成鲁棒特征”,2008年,第1096–1103页。[6] “外汇和外汇市场平台”https://www.metatrader5.com/en.[7] “交易勘探工具”https://www.amibroker.com/index.html.[8] “财务图表网站”http://stockcharts.com/.[9] “Theano,”http://deeplearning.net/software/theano/.[10] “scikit学习:python中的机器学习”http://scikit-learn.org/stable/.[11] Ta库:技术分析库http://ta-lib.org/.[12] X.Glorot和Y.Bengio,“理解训练深度前馈神经网络的困难”,载于《国际艺术情报与统计会议论文集》,2010年。[13] T.Tieleman,“使用似然梯度近似值训练受限boltzmann机器”,《第25届国际机器学习会议记录》(ICML),2008年,第1064-1071页。[14] 辛顿(G.E.Hinton),在《神经网络:交易技巧》(第二版)中,ser。计算机科学课堂讲稿。斯普林格,第599-619页。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 13:41