楼主: 何人来此
1673 24

[量化金融] 基于深度学习的金融时间序列预测 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-1 16:48:20
4.5拟议的概率交易策略利用神经网络输出的软信息p(y | x),用于估计αp(y | x)。第4.1节介绍了关于开盘交易的交易策略(何时“买入”),而第4.2节讨论了成交(何时“卖出”)。使用多头和空头交易,头寸可以基于积极或消极的预期价格趋势打开。4.1使用软信息的贸易开放利用DL模型提供的软信息p(y | x),可以选择预测精度更高的贸易子集,提高收益G,同时考虑佣金。对于我们考虑的分类裕度,例如αn=1,如果kp(y | x)- p(y | x)k≥ TH0,如果kp(y | x)- p(y | x)k<TH,4.6,其中这是通过交叉验证确定的。由于财务过程的非平稳性,使用固定阈值TH应用公式4.6可能不准确。因此,我们建议通过交叉验证计算自适应阈值,其中我们应用TH来估计D个先前数据点的中值增益。还使用交叉验证和验证集估计D的值。我们还考虑了一种贪婪的方法,即选择一个阈值THD,使D个先验点的增益最大化,但结果表明该方法是不稳定的,精度较低。使用自适应阈值THallows选择一部分可交易点。然而,更高(且更现实)的交易佣金(超过交易量的0.05%)需要进一步筛选活跃交易点αn。

12
可人4 在职认证  发表于 2022-6-1 16:48:23
为此,我们建议避免在∈ 【n,n+NSaf要素】当损失数量(负收益交易)超过预先定义的阈值时,表示为NSaf eT riggernXn-Nsalex in+1(gnT C<0)≥ NSaf eT rigger4.7最后一种筛选机制,旨在通过实验避免错误分类模式,被称为“安全开关方案”。由此产生的贸易开放方案如图3所示。预测模型选择性交易启动模块的自适应软阈值-1+1根据D之前的可选交易打开多头头寸集TH(t)| p2(y | x)-p1(y | x)|>TH?安全开关是否关闭?是的,是签名(p2(y | x)-p1(y | x))打开空头位置TH(t)更新安全开关状态gtc(t-D-1,…,t-1),TH(t-D-1,…,t-1)p(y | x)损益日志gtc(t-D-1,…,t-1)不打开新位置no图3:建议的基于软阈值的交易打开方法。安全开关方案显著减少了贸易开放的数量,减少到~数据点总数的1%,如图5所示。因此,选择更可靠的网络预测。我们将其归因于趋势预测DL方案的低确定性,该方案仅能正确分类53%的时隙,以及高TCvalue与单笔交易的时间收益值GNO相匹配。4.2设置交易纵向研究nc>no时的交易结束(“出售”)事件,其中NOA和NCA分别为交易开始和结束时间。考虑到第3.4节中提到的预测区间T,我们考虑了选择每笔交易终点的三个选项。首先,根据p(y | x)的预测,在T分钟后结束交易,这样nc=否+T 4.8秒,在nc结束交易,这样硬决策序列会改变^y(nc)6=y(no)。4.9最后,我们测试了硬决策序列改变后的等待T分钟,如等式4.9所示。

13
nandehutu2022 在职认证  发表于 2022-6-1 16:48:26
我们发现等式4.9最为准确,它允许不同长度的自适应交易持续时间。5实验结果通过将数据集拆分为暂时不重叠的训练集、验证集和测试集,研究了所提出的DL方案的适用性。测试集包括2014年6月23日至2016年6月22日的数据。验证集基于上一日历年(2013年6月23日至2014年6月22日)的数据,之前的所有数据都用作培训集。因此,我们的模型没有考虑市场动态的变化,并且隐含地假设使用2013年之前的数据学习的策略可以应用于2016年的交易。我们使用收盘价数据进行交易,并选择交易量大、流动性强的资产,以便始终按时执行订单(“价差”和“滑移”效应被忽略)。在每一笔交易中,我们都投资了一笔相等的金额,收益结果和交易成本都以该金额的百分比来衡量,我们对买卖双方都采用了综合佣金率。我们报告了两年测试期间的累计收益,即该期间所有活跃交易的收益之和。5.1实验设置通过使用从Quantroute市场数据供应商处购买的标准普尔500(“标准普尔500”)资产的市场数据,以一分钟的分辨率对拟议方案进行了实验验证【31】。对于所分析的每项资产,我们利用了完整交易日的所有可用历史数据,基于常规交易时间(上午9:30-下午4:00),并忽略了非工作时间的交易数据。

14
可人4 在职认证  发表于 2022-6-1 16:48:30
我们还省略了部分交易时间的日期,以及通常高达数据点2-3%的盈利发布期,并在数据集中给出。当我们研究日内交易时,数据被分为不同的交易日,所有特征均来自当前交易日,不允许隔夜交易。每个交易日的数据都被解析为~ 300个不同的数据样本,我们使用前面M=60分钟的原始收盘价数据作为特征。每个输入序列通过五个抽头长的移动均匀平均值进行过滤,然后通过减少平均值并除以其标准偏差进行归一化。按照公式3.1设置训练标签,并针对不同的T值训练多个模型。对于每个资产,我们使用交叉验证选择T,其中公共值范围为20-30分钟,如表1所示。我们采用过采样来平衡训练集和验证集,这样将有相等数量的正负训练样本用于趋势预测。解析和平衡后数据集的总体大小取决于每个资产的可用数据日期、模型参数和交易策略。对于T=1的SPY ETF(详见第5.3节),有~ 平衡前的1.2M样本,分为967K训练样本、81K验证样本和164K测试样本。测试集不平衡。预测模型基于图2所示的神经网络,该神经网络是使用MatConvNet软件包[32]对其进行训练的,该软件包的小批量大小为100,当在训练期间观察到验证集的误差减小时,学习率自适应地降低了5倍。验证集也用于早期停机。

15
mingdashike22 在职认证  发表于 2022-6-1 16:48:33
该模型提供的可靠性软信息被拟议的概率交易策略用于检测高置信交易。5.2实施细节我们的基本神经网络模型的网络架构如图2所示。它有5个完全连接的层,包括500、200、40、20和2个ReLU激活单元。第一层和第二层之后是辍学。输入的是60 1低通滤波的相邻历史原始价格值。我们使用随机梯度decent来训练批量为100、辍学率为0.5的模型。初始学习率为0.001,随着验证错误停止减少,下降到1e-7的学习率,下降系数为5。所有初始权重均从高斯分布中采样,标准偏差为0.01。我们在MatConvNet框架下实现了该系统。对于整个系统框架,在singleNvidia GeForce GTX 780 GPU上,每个输入单一价格向量的平均推断时间为0.2ms。5.3 SPY ETF的主动交易我们将拟议的主动交易应用于SPY ETF,即SPDRexchange交易基金(ETF)——一种标准普尔存托凭证,旨在跟踪标准普尔500指数,允许投资者使用单一工具买卖整个标准普尔500指数,以此为例说明了我们的计划。这是交易量和流动性最大的ETF之一。使用交叉验证将学习周期D和位置保持时间T分别设置为D=5和T=28,如附件1所示。在我们数据的最后两年(2014年6月23日至2016年6月22日)的测试期间,间谍价格增长了10.63%。图4描述了不同模型在测试期间相对于预测范围T的累积交易收益。我们为每个T值训练了不同的DL预测模型,并报告了不同交易成本的结果。

16
kedemingshi 在职认证  发表于 2022-6-1 16:48:36
因此,通过根据验证集(表1)设置D和T选择的DL模型在0.1%的佣金测试期间产生61.1%的累积收益。D=1 D=5 D=10 D=50T=1 1.5-0.8-0.5 0T=4 0.5 0.1-0.8-3.3T=8 1.8 0-0.6-2.5T=12 3.8 2.7 2.3-1.2T=16 0 2.3 2.1 0.3T=20-3.7 6.8 3.1-7.8T=24 5.7 20.2 20.1-8.9T=28 2 21.2 18.9-3.7T=32 5.1 16.9 16-8.2表1:商品标签长度T和自适应阈值窗口长度D的交叉验证结果。我们报告了拟议的主动交易策略在一年验证期内的累积收益,以及0.08%的佣金。模型预测范围(最小值)0 5 10 15 20 25 30 35两年累计收益[%]-200204060801001200.15%0.13%0.1%图4:不同模型预测范围两年内SPY ETF的累计交易收益。我们报告了不同佣金率的结果。我们在图5中展示了拟议交易方案的不同阶段的效果,图5描绘了应用拟议方案的不同组成部分时交易收益的直方图。为此,我们比较了以下方案:o固定交易长度T=1。

17
kedemingshi 在职认证  发表于 2022-6-1 16:48:39
没有用于选择性交易初始化的自适应软阈值和安全切换机制。o改变交易长度,当模型预测序列改变方向时关闭交易,无需自适应软阈值和安全开关可变交易长度和自适应软阈值,无需安全开关。o利用第4节中提出的所有组件。因此,拟议方案的分布优于其他方案,其中很大一部分分布集中在零收益仓位,与拟议方法的基本假设相对应,因为只选择可能实现正收益的交易。单笔交易收益[%]-包括佣金-0.5-0.4-0.3-0.2-0.1 0.1 0.2 0.3 0.4 0.5概率00.0050.010.0150.020.0250.030.0350.040.0450.05交易长度1,无自适应Thershold,无安全开关可变交易长度。无自适应阈值,无安全开关可变交易长度和自适应阈值。无安全切换-可变交易长度、自适应阈值和安全切换图5:测试期间每笔交易的收益概率。我们报告了拟议方案不同配置的结果。5.4与基准的比较为了评估我们基于深度学习的主动交易方法的性能,我们对比了支持向量机(SVM)方案,该方案被认为是最先进的分类方案。测试期间的结果如图6所示,在每个时间点,我们报告从第一个测试日开始的累积增益。两种主动交易策略(基于DL和基于SVMBase)如图所示。

18
nandehutu2022 在职认证  发表于 2022-6-1 16:48:42
6,包括0.06%(买入和卖出)的交易成本,其中买入和持有策略不收取佣金。通过对解析后的数据库应用主成分分析,实现了带有RBF核的核支持向量机,同时保留了95%的数据方差,从而将维数从60降到了7。保留方差值越高,结果越差。建议的概率交易策略使用了SVM的分类概率估计。这些结果与基线资产价格变化进行了比较,与买入并持有策略相对应。图7显示,提出的DL方案优于基于SVM的模型和assetbaseline基准。然而,随着交易成本的增加,以佣金为基础的模型(如我们的模型)的适用性降低,导致与买入并持有被动策略相比,性能较差。交易分钟指数(连同2年的回测)#1040 2 4 6 8 10 12 14 16累计收益[%]-50050100150200250300主动间谍交易-深度学习模型(佣金0.06%)主动间谍交易-SVM模型(佣金0.06%)买入并持有-间谍ETF[%]。无佣金图6:累积交易收益。我们报告了所提出的基于深度学习的模式、利用所提出的概率交易策略的SVM预测模型和买入持有策略的性能。5.5活跃股票交易在本节中,我们将拟议方案应用于标准普尔500指数的九只股票:INTC(国际公司)、AAPL(苹果公司)、GOOGL(谷歌)、BAC(美国银行公司)、AMZN(亚马逊公司)、KO(可口可乐公司)、T(美国电话电报公司)、JNJ(强生公司)、BA(波音公司)。我们采用了与前一节相同的方案,其中分别为每个股票训练了一个模型。

19
nandehutu2022 在职认证  发表于 2022-6-1 16:48:46
测试和验证周期与SPY ETF相同。图8显示了两年测试期内不同工具(包括SPY)相对于不同交易佣金的累积收益,由此得出,不同工具的累积收益不同,虽然取得了积极的结果,但它们强烈依赖于交易成本。图9给出了进一步的分析,其中我们研究了每日回报,假设统一买卖佣金为0.1%。图9a报告了不同工具每日收益结果的平均值和标准差(波动率),而图9b描述了中位数,25%和75%的百分比每交易佣金(买入和卖出)[%]0 0.05 0.1 0.15累积收益[单交易百分比]050100015002000250030003500主动交易-深度学习模型主动交易-SVM模型买入和持有-间谍ETF基线(a)每交易佣金(买入和卖出)[%]0.1 0.105 0.11 0.115 0.12 0.125 0.13 0.135 0.14 0.145 0.15累积收益[单交易百分比]01020304050600主动交易-深度学习模型主动交易-SVM模型买入持有-SPY ETF基线(b)图7:两年测试期内作为交易成本函数的总体累积收益。我们报告了针对深度学习模型和支持向量机模型提出的概率主动交易策略的结果。,以及买入并持有的投资策略。(a) 一系列佣金。(b) 高佣金范围。以及含有99.3%样本的区域。金融资产的波动性是衡量其风险的重要指标[33]。表2和图10报告了十种工具DL法的两年累计回报率以及相应的波动率。

20
何人来此 在职认证  发表于 2022-6-1 16:48:49
波动率计算为年化历史波动率,由σAnn=pNminute·ST D(gT C)5.1给出,其中nminute是每年的交易分钟数,gT Cis是分钟级回报向量。我们还报告了基准仪器价格。因此,拟议的主动交易方案的绩效与资产波动率相关,如图10所示。图11显示了年度夏普比率【34】与使用建议方法的不同资产的佣金。由于夏普比率[35]量化了风险调整后的回报,因此它与所有资产的佣金密切相关。标准普尔500指数的长期夏普比率通常为0.406,可作为参考。因此,对于0.07%及以下的佣金,所有资产的夏普比率均达到0.5以上,对于0.1%的佣金,三项资产(T、JNJ和KO)表现不佳。应注意的是,这三种工具在所有测试资产中波动性最低。每笔交易的佣金(买入和卖出)[%]0 0.05 0.1 0.15累积收益[单笔交易的百分比]0501000150020002500300003500SPYINTCAPPOOGLBACAMZNKOTJNJBAFIGURE 8:作为交易成本函数的两年回测累积交易收益(买入和卖出的未确认成本)。每个图表代表不同的工具。主动贸易基准Ann。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 03:35