楼主: nandehutu2022
1154 32

[量化金融] 深度学习可以在限额订单簿中复制适应性交易者 [推广有奖]

21
mingdashike22 在职认证  发表于 2022-6-11 03:05:37
可以制定时间表,使“牛市”的价格持续上涨,“熊市”的价格稳步下降,停滞的市场价格沿着一条平坦的线走,以及在牛市、熊市和横向运动期间具有各种形式的振荡或多阶段变化的市场。每个交易员在完成客户的最后一次分配时,都会收到一份新的随机生成的客户订单。对BSE的开源版本进行了编辑(以简单明了的方式),以便为市场上的每个交易员制作“综合磁带”(如上文第II.C节所述),记录加盖时间戳的LOB数据、客户订单限额价格和报价活动。在一系列涉及数千份订单的市场会议之后,将确定一个成功的ZIP交易员,然后将其合并磁带中的数据分为一个训练集和一个测试集,然后用于DLNN交易员的培训和评估。正如文献[3]中充分解释的那样,我们研究了两种类型的LNN的响应:多层感知器[24、6、26];和长-短期记忆[20,6,26]。我们将这两种类型分别称为MLP-DLNN和LSTM-DLNN。这些之前在布里斯托尔的早期工作中已经探讨过,第二节讨论了这些问题。下面的F和在[35]中显示出希望的网络架构构成了本文报告工作的起点。记录训练集和测试集的均方根(RMS)误差,训练后误差足够低的DLNNS被视为成功。

22
nandehutu2022 在职认证  发表于 2022-6-11 03:05:40
MLP和LSTM DLNN都是通过运行在开源机器学习软件systemTensorflow上的开源工具包Keras创建的。[3]中给出了用于生成此处报告结果的KERA的示例配置文件。然后,成功的DLNN与其他机器人交易员一起加入疯牛病市场,并在足够长的时间内参与市场活动,以从“实时交易”中产生可靠的结果,最终测试DLNN交易是否真正学会了复制(或改进)生成训练和测试数据的原始自适应交易算法的性能。我们探索了两种形式的现场交易:异类交易,即将一名训练有素的DLNNtrader添加回生成该交易员紧张数据的市场;和同质市场,即amarket完全由训练有素的DLNNtrader克隆而成:这种同质市场在早期的研究中经常被研究(例如[7,8,37])。F、 相关工作虽然关于时间序列预测,特别是金融时间序列预测,有一个长期存在且非常庞大的文献,但重要的是要认识到,这些工作在这里都不相关,因为我们没有使用机器学习来预测市场中的未来交易价格。相反,我们使用机器学习来复制交易者为响应动态变化的LOB而生成的动作序列;什么样的操作是合适的取决于上下文的,取决于该交易者当前的限价(如交易者当前工作的客户订单中所规定)。

23
能者818 在职认证  发表于 2022-6-11 03:05:43
DLNN交易者发布的报价是否被另一交易者接受或忽略将决定该特定报价是否对市场交易价格的时间序列有任何影响,但被忽略的交易(因此对交易价格时间序列没有直接影响)仍然可以在价格发现中发挥重要作用,即,在交易发生之前,改变LOB上的BID和报价数组。据我们所知,之前的工作只有三个直接相关的部分,所有这些都是最近才发表或出版的,没有一个结果与我们的直接可比。第一篇是2017年的硕士论文【35】,由我们中的一位(Cliff)指导,该论文在使用DLNN复制疯牛病中ZIP交易员的行为方面取得了一些有希望的初步进展,但并没有像第二节之前所述的那样,在随后的“现场交易”中对训练有素的DLNN采取关键步骤。E、 第二篇是期刊论文【36】,已被《IEEE工业信息交易》接受发表,但目前仍在出版中,预计将于2018年晚些时候发表。在本文中,LSTM用于复制基本行为,即生成简单的买入/持有/卖出交易信号,这是由三种非常简单的非适应性交易策略产生的,这些策略仅适用于简单的交易价格时间序列,因此不使用二级LOB数据。

24
大多数88 在职认证  发表于 2022-6-11 03:05:46
这三种策略是:随机选择(不考虑金融时间序列);交叉(当时间序列的短期移动平均线与长期移动平均线交叉时,生成交易信号);和MACD(代表提供平均收敛/发散,这是交叉策略的扩展,包括振荡动量项)。文献[36]的作者报告了他们的方法的成功,这证明了DLNN可以学习简单的非自适应渐变策略。然而,我们的工作大大扩展了他们的结果,因为我们使用LOB数据,并要求DLNN了解自适应机器人的交易行为,这种机器人可以从市场经验中学习,而不是盲目地遵循相同的简单策略,无论市场事件如何。第三份出版物【29】目前只能在流行的ArXiv网站上作为印刷品提供,并且可能目前正在接受同行审查。在本文中,作者报告了如何使用DLNNs,这些DLNNs是在真实世界中大量的高频金融市场报价和交易中训练出来的。[29]中的结果表明,使用价格和订单流历史可以提高预测性能,并在现实世界金融市场的价格动态中显示路径依赖性。

25
何人来此 在职认证  发表于 2022-6-11 03:05:50
与我们的工作不同,我们没有试图明确地学习复制特定适应性交易者(人类或机器人)的行为,而是深入了解数十亿个报价和交易数据项中可靠可观察的统计规律。因此,据我们所知,这里展示的结果是首次展示了在现实的(基于LOB的)金融市场中,使用DLNNs成功复制适应性交易者的能力,这些能力之前已被证明与人类交易者相当。三、 结果与分析图。2显示了从(MLPDLNN根据ZIP交易员提供的数据进行培训,该交易员为交易价格呈下降趋势的市场中的客户处理购买订单:图中的标题解释了图表的细节。从图中可以清楚地看出,用于培训MLP-DLNN的ZIP交易员的报价时间序列与qu的时间序列之间有很好的定性匹配当MLP-DLNN显示来自训练数据集的输入向量时,它会发出提示:这表明学习已成功捕获训练期间从输入向量到输出向量的映射。当MLP-DLNN交易者呈现之前未看到的训练数据时,保持了良好的定性匹配,这表明DLNNsystem已经学习了一个有用的非平凡泛化,并且没有过度拟合测试集。

26
mingdashike22 在职认证  发表于 2022-6-11 03:05:53
图2代表了生成的所有成功结果:对于另外9个示例图,不同类型的市场(牛市、熊市、横向市场、多相市场)见图3.2和3.3,其中还列出了RMS误差值。图3显示了成功的MLP-DLNN的异质实时交易测试(如上文第II.E节所述)的结果。这表明ZIP“教师”订单时间序列和相应的MLPDLNN“学生”时间序列之间有很好的定性匹配,但在livetrading中真正重要的是交易者累积的利润,即盈利能力。图2:说明性结果,来自MLP DLNN的报价流,根据ZIP机器人交易员的数据进行训练,在价格呈下降趋势的市场中,工作客户购买订单,约2200个报价流。蓝线是由运营在线疯牛病的ZIP交易员生成的报价时间序列,并记录下来以生成一组用于培训和测试的目标输出向量。未显示输入向量(LOB数据和客户订单限额价格)。绿线显示DLNN对训练集中使用的输入向量的相应输出,红线显示DLNN对测试集中使用的输入向量的响应输出。为了量化ZIPtraders和训练有素的MLP-DLNN交易员之间的盈利能力差异,我们首先进行了50次同质市场的统计独立运行,其中市场中的所有10名交易员都是相同的ZIPtraders;然后,我们用训练有素的MLP-DLNN交易员替换了一个任意选择的ZIP交易员,并运行了另一个50个不同的市场会话。

27
能者818 在职认证  发表于 2022-6-11 03:05:56
在异质市场交易中,我们记录了单个MLP-DLNN交易员在每个交易日结束时累积的最终利润,给我们提供了该交易员的50个样本;从同质ZIPmarkets中,我们记录了ZIP交易者记录的50个交易日末利润值,该交易者随后被LP DLNN交易者所取代。这给了我们两个期末利润值的样本,每个样本的大小为n=50。图4中的方框和胡须图显示了两个n=50样本分布的关键汇总统计数据的比较,这两个样本分布是由生成图3中时间序列数据的MLP DLNN和ZIP交易员生成的。图4所示数据的单尾(即方向性)Wilcoxon-Mann-Whitney Utest表明MLP结果明显优于ZIP结果:p<0.01;也就是说,MLP DLNN的利润在统计上明显好于(即更高)可比ZIP交易员市场的利润。[3]中给出的其他结果表明,在异质市场中,LP DLNN交易者比ZIP交易者具有同样显著(更大幅度)的绩效优势,表明图4中的结果并非孤立的成功。因为ZIP交易者之前已经被证明比人类交易者表现更好,并且因为MLP-DLNN交易者在这里已经被证明比ZIP交易者表现更好,所以从三段论的角度推断,我们在这里给出的结果证明MLP-DLNN交易者也可以学着比人类交易者表现更好,这似乎是合理的。

28
mingdashike22 在职认证  发表于 2022-6-11 03:05:59
也就是说,我们在这里已经证明,深度学习可以应用于复制全球主要金融市场中使用的基于LOB的交易市场中适应性交易者的行为,通过观察已知持续优于人类交易者的algo交易者的行为生成的训练数据。为简洁起见,我们在此依赖少量插图说明MLP-DLNN“学生”交易者可以学习到与aZIP“教师”交易者相同或优于aZIP“教师”交易者的表现;其他图表、表格和统计重要性测试见【3】。然而,如图4所示,MLP-DLNN在实时交易测试中的表现明显优于ZIP。图3:成功训练的MLP-DLNN的异构实时交易测试的说明性结果;i、 e.将一个训练有素的MLP-DLNN重新输入市场,从中生成其培训和测试数据。绿线表示市场交易价格的时间序列;ZIP“教师”自动交易系统的报价时间序列以蓝色显示,“学生”MLP-DLNN交易员的报价时间序列以红色显示。ZIP教师和MLP DLNNstudent的交易活动之间有良好的质量一致性。交易价格(绿色)与报价价格(红色/蓝色)相差甚远的时期表明该交易员试图在不利市场环境下下下订单。图4:50个同质市场交易日和10个ZIPtraders(蓝色,左侧方框和胡须图)的汇总统计数据,以及50个异质市场交易日和9个Zip交易员和1个成功的MLP-DLNN交易员(橙色,右侧图)的汇总统计数据。

29
大多数88 在职认证  发表于 2022-6-11 03:06:02
垂直规模是市场交易结束时的累计利润总额。阴影框内的水平线是大小为n=50的样本中的主题值;阴影框的上界和下界分别为上四分位数和下四分位数。胡须的末端有正负两个标准差。四、 进一步的工作随着这项工作的进一步开展,我们目前正在关注两个主要的调查渠道。一个是探索那些成功学习到优于用于生成训练数据的交易者的DLNN的程度,以揭示他们如何以及为什么优于原始交易者,即提出因果机制特征和改进绩效的解释。另一种方法是使用自动优化技术,消除人为猜测的反复尝试,以获得令人满意的DLNN网络架构(层数、每层中的节点数)。工作正在进行中,取得了一些有希望的早期结果,我们希望在未来的论文中报告积极的进展。五、 结论在本文中,我们证明了一个合适配置的DLNN可以学习复制一个成功的自适应自动交易者的交易行为,ZIP算法策略之前被证明优于人类交易者。我们还证明,与提供培训数据的ZIP交易员相比,DLNNs可以学习更好的表现(即更具盈利能力)。我们认为,这是首次证明,DLNNs能够成功地复制比人类适应性交易者更好的交易者,在真实世界金融市场的现实模拟中进行操作。

30
能者818 在职认证  发表于 2022-6-11 03:06:05
我们的结果也可以被视为概念证明,DLNN原则上可以观察真实金融市场中人类交易者的行为,随着时间的推移,学会与人类交易者一样进行交易,甚至可能更好。参考文献[1]S.Arnak和J.Saluzzi,《破碎的市场》,普伦蒂斯大厅,2012年。[2] H.Bodek&S.Dolgopolov,《市场结构危机:电子股票市场、高频交易和暗池》。Decimus,2015年。[3] A.le Calvez,《学习成为一名金融交易员:在连续双重拍卖中探索神经网络》。未出版的硕士论文,布里斯托尔大学计算机科学系,2018年。[4] J.Cartlidge&D.Cliff,《探索“机器人相变”非实验人类算法市场》,英国政府科学办公室,《预见驾驶员评论》DR252012年:https://bit.ly/2llHjbh[5] J.Cartlidge、C.Szostek、M.De Luca和D.Cliff,《太快太愤怒:更快的金融市场交易代理可能会产生效率更低的市场》,Proc。《第四届代理与人工智能国际会议》,第二卷代理(ICAART),J.Filipe&A.Fred编辑,第126-135页,2012年。[6] F.Chollet,《Python深度学习》,曼宁,2018年。[7] D.Cliff,《市场环境中讨价还价行为的最低限度情报人员》。惠普实验室技术报告HPL-97-91,http://www.hpl.hp.com/techreports/97/HPL-97-91.pdf.1997年[8]D.Cliff,“双拍卖市场自适应交易代理的遗传优化”。过程中。1998年Conf.ComputationalIntelligence for Financial Engineering(CIFEr),IEEE/IAFE/Informs,pp.252--2581998。修订版:HP实验室技术报告hpl-2001-99:www.hpl。hp。com/techreports/2001/HPL-2001-99。pdf【9】D.Cliff&L。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-11 17:56