|
二是递归神经网络与LSTM递归神经网络之间的性能。最后但并非最不重要的一点是,我们将不仅尝试最大化下行偏差率,还将在时间序列持续下降的情况下输入信号和波动信号,以尝试保护投资的下行。我们还将比较使用下行偏差率和夏普比率的性能。这些外汇模拟证明了循环强化学习算法在真实金融价格序列中发现交叉结构的能力。我们的目标是在几乎不需要手动参数调整的情况下找到最佳解决方案,并可以优化任何交易期的性能。为了进行实验,它是用Python实现的,带有Pandas、Numpy、Sklearn、Keras和Tensor flow库。我们从美元/英镑价格系列中提取2000个数据点,我们使用2017年6月1日至2017年3月2日的1000个30分钟间隔价格点作为训练集,再次使用2017年3月2日至2017年6月3日的1000个30分钟间隔价格点作为测试集。回顾方程(4),sFt的第一项-1是t-1期间投资决策的回报。例如,如果S=10股,交易者做出的决定是购买允许的最大值的一半,每股增加rt=2。然后,这个期限将是10,这是忽略t期间发生的交易成本的总回报率。F期限可以是长的、短的或中性的,也可以用数学表示为[-1,1]。我们在本实验中使用的所选机器人交易员将使用LSTM以及具有55%辍学率和连续200个预测数据点的重复强化学习。我们将在第二个问题中进一步讨论递归强化学习与递归强化学习的区别。我们将有偏项一设为b=1,一设为b=5。
|