楼主: 大多数88
1123 29

[量化金融] 利用平稳极限进行价格预测的深度学习 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
70.7797
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-6-11 00:26:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Using Deep Learning for price prediction by exploiting stationary limit
  order book features》
---
作者:
Avraam Tsantekidis, Nikolaos Passalis, Anastasios Tefas, Juho
  Kanniainen, Moncef Gabbouj, Alexandros Iosifidis
---
最新提交年份:
2018
---
英文摘要:
  The recent surge in Deep Learning (DL) research of the past decade has successfully provided solutions to many difficult problems. The field of quantitative analysis has been slowly adapting the new methods to its problems, but due to problems such as the non-stationary nature of financial data, significant challenges must be overcome before DL is fully utilized. In this work a new method to construct stationary features, that allows DL models to be applied effectively, is proposed. These features are thoroughly tested on the task of predicting mid price movements of the Limit Order Book. Several DL models are evaluated, such as recurrent Long Short Term Memory (LSTM) networks and Convolutional Neural Networks (CNN). Finally a novel model that combines the ability of CNNs to extract useful features and the ability of LSTMs\' to analyze time series, is proposed and evaluated. The combined model is able to outperform the individual LSTM and CNN models in the prediction horizons that are tested.
---
中文摘要:
近十年来,深度学习(DL)研究的激增成功地解决了许多难题。定量分析领域一直在缓慢地适应新方法以解决其问题,但由于金融数据的非平稳性等问题,在充分利用DL之前,必须克服重大挑战。本文提出了一种新的构造平稳特征的方法,该方法可以有效地应用DL模型。在预测限价指令簿的中间价格变动的任务中,对这些功能进行了彻底的测试。对几种DL模型进行了评估,如递归长短时记忆(LSTM)网络和卷积神经网络(CNN)。最后,提出并评估了一种新的模型,该模型将CNN提取有用特征的能力与LSTMs分析时间序列的能力相结合。在所测试的预测范围内,组合模型能够优于单独的LSTM和CNN模型。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Using_Deep_Learning_for_price_prediction_by_exploiting_stationary_limit_order_bo.pdf (367.17 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:价格预测 深度学习 Quantitative Applications Econophysics

沙发
nandehutu2022 在职认证  发表于 2022-6-11 00:26:20
通过利用StationArlimit订单簿功能,利用深度学习预测价格Savraam Tsantekidisa、Nikolaos Passalisa、Anastasio s Tefasa、Juho Kanniaineb、MoncefGabboujc、Alexandro s Iosi fidisdadepartment of Information、亚里士多德塞萨洛尼基大学、塞萨洛尼基、坦佩雷科技大学GreecebLaboratory of Industrial and Information Management、坦佩雷、,丹马克奥胡斯大学坦佩雷理工大学芬兰德信号处理实验室(FinlandClarotory of Signal Processing),芬兰德工程、电气和计算机工程系(FinlanddDepartment of Engineering,Electrical and Computer Engineering,Aarhus University,Denmark Abstracts)。过去十年来,深度学习(DL)研究的热潮成功地为许多难题提供了解决方案。定量分析领域一直在缓慢地将新方法适应其问题,但由于金融数据的非静态性质等问题,在充分利用DL之前,必须克服重大挑战。本文提出了一种新的构造静态特征的方法,该方法可以有效地应用DL模型。在预测限额订单的中期变动的任务中,对这些特征进行了全面测试。对几种DL模型进行了评估,如递归长短时记忆(LSTM)网络和卷积神经网络(CNN)。最后,提出并评估了一种新模型,该模型将CNN提取有用特征的能力与LSTM分析时间序列的能力相结合。在所测试的预测范围内,组合模型能够优于单独的LSTM和CNN模型。关键词:限价订单、平稳特征、价格预测、深度学习1。简介在过去十年中,由于深度学习(DL)带来了深刻的性能改进,机器学习(ML)得到了快速发展。

藤椅
可人4 在职认证  发表于 2022-6-11 00:26:23
深度学习在机器学习的许多领域,如自然语言处理(NLP)[1]、图像处理[2]和语音生成[3],都优于以前最先进的方法。随着将深度学习纳入许多科学领域的新方法数量的增加,所提出的解决方案开始跨越机器学习能力有限的其他学科。一个这样的例子是对股票市场的定量分析,以及使用机器学习来预测价格变动或未来价格的波动,或检测市场中的异常事件。在定量分析领域,市场的数学建模已成为模拟交易、做市、对冲和风险的股价动态的实际方法电子邮件地址:avraamt@csd.auth.gr(Avraam Tsantekidis),passalis@csd.auth.gr(尼古拉斯·帕萨利斯),tefas@aiia.csd.auth.gr(Anastasios Tef as),juho。kanniainen@tut.fi(Juho Kanniainen),moncef。gabbouj@tut.fi(Moncef Gabbouj),alexandros。iosifidis@eng.au.dk(Alexandros Iosi fidis)管理层。通过利用价值的时间序列,如市场上交易的金融产品的价格波动,可以构建统计模型,帮助提取有关市场当前状态的有用信息和未来可能状态的概率集,如价格或波动性变化。许多模型,如Black-Scholes-Mer-tonmodel[4],试图从数学上推断期权价格,并可用于提供未来价格变动的有用指示。然而,在某种程度上,随着越来越多的市场参与者开始使用同一模型,价格行为改变到了无法再利用的程度。

板凳
nandehutu2022 在职认证  发表于 2022-6-11 00:26:26
较新的模型,如限价指令簿动态的随机建模【5】、股票动态的跳跃扩散过程【6】和市场微观结构噪声的波动性估计【7】已尝试预测金融市场的多个方面。然而,这些模型的设计是为了易于处理,甚至是为了降低可靠性和准确性的成本,因此它们不一定能很好地拟合经验数据。上述特性使手工制作的模型处于不利地位,因为金融市场经常表现出非理性行为,这主要是由于人类活动的巨大影响,从而导致这些模型失败。将机器学习模型与手工制作的功能相结合,通常可以克服上述一些限制,并改善对金融市场各个方面的预测,从而提高此类模型的预测能力。这导致许多参与金融市场的组织,如对冲基金和投资公司,越来越多地使用ML模型以及传统的数学模型来做出关键决策。此外,电子交易的引入,也导致了交易操作的自动化,扩大了交易量,产生了丰富的数据。深度学习模型(Deep Learningmodels)是分析此类数据量的完美候选模型,因为当有大量数据可用时,它们的表现明显优于传统的机器学习方法。这也是深度学习开始在分析金融交易所数据方面发挥作用的原因之一。[8、9]金融交易所正在收集的最详细数据类型是其内部匹配引擎中发生的每个提交订单和事件的综合日志。

报纸
可人4 在职认证  发表于 2022-6-11 00:26:28
此日志可用于重新构建限额订单簿(LOB),第3节将对此进行进一步解释。从这些数据中可以得出的一项基本任务是,通过检查当前和过去的限价订单供需情况,预测资产未来的价格变动。交易所保存的这类综合日志数量过大,传统的机器学习技术,如支持向量机(SVM)[10],通常无法立即应用。由于这种数据的非平稳性,现有的深度学习方法也不可能直接利用这种数据。价格会受到随机漂移的影响,因此为了让DL方法有效地利用价格,需要一个预处理步骤来生成平稳特征。这项工作的主要贡献是提出了一组可以从限额订单簿中自由提取的平稳特征。使用几个不同的深度学习模型,从简单的多层感知器(MLP)和CNN到递归神经网络(RNN),从大规模高频限价订单数据,对拟议的特征进行全面评估,以预测未来的中间价变动。此外,我们还提出了一种新的深度学习模型,该模型将卷积神经网络(CNN)的特征提取能力与长短时记忆(LSTM)网络分析时间序列的能力相结合。第2节简要介绍了在财务数据上采用ML模型的相关工作。然后,第3节详细描述了使用的数据。第4节详细介绍了拟议的平稳特征提取方法,第5节描述了拟议的深度提取方法。第6节提供了实验评估和比较。最后,得出结论,并在第7.2节中讨论了未来的工作。

地板
大多数88 在职认证  发表于 2022-6-11 00:26:31
相关工作回归金融资产未来变动的任务已成为许多近期工作的主题,如【11、12、13】。GARCH等经验证的模型通过人工神经网络等机器学习组件进行了改进和增强[14]。新的混合模型与神经网络一起使用,以改进之前的性能【15】。外汇市场是最不稳定的金融市场之一。在[16]中,神经网络用于预测美元/欧元等主要外汇对的未来汇率。该模型通过从每日到每年的不同预测步骤进行测试,得出结论,短期预测往往更准确。其他财务指标,如现金流预测,与价格预测密切相关。在[17]中,作者提出了“深度投资组合理论”,该理论应用自动编码器s来生成最优投资组合。这种方法优于一些既定的基准,如生物技术IBB指数。同样,在[18]中,另一种类型的自动编码器,称为受限玻尔兹曼机(RestrictedBoltzmann Machine,RBM),用于对股票的月末价格进行编码。然后,对模型进行微调,以预测价格变动是否会超过中值变化以及这种变动的方向。该策略能够在年度回报方面优于b enchmark动量策略。另一种方法是纳入金融时间序列以外的数据源,如[19],其中与金融相关的短语,如“抵押”和“破产”,在Googletrends平台上进行监控,并将其与标准普尔500市场基金的每日价格一起作为递归神经网络的输入。培训目标是预测市场基金价格的未来波动性。

7
mingdashike22 在职认证  发表于 2022-6-11 00:26:34
这种方法可以大大优于许多基准方法,如自回归GARCH和Lasso技术。DL方法的激增极大地改善了许多传统机器学习方法在任务上的性能,如语音识别[20]、图像字幕[21、22]和问答[23]。DL最重要的构建模块是C进化神经网络(CNN)[24]和递归神经网络(RNN)。还值得一提的是RNN的改进,引入了长-短期记忆单元(LSTM)[25],这使得使用DL分析时间序列更容易、更有效。不幸的是,DL方法容易过度拟合,特别是在任务s中,如s价格回归,许多工作都试图防止这种过度拟合[26,27]。有些人可能会将过度配置归因于缺乏其他任务(如图像和语音处理)可用的大量数据。一个非常丰富的年度预测数据源是限额订单簿。ML在高频限额订单数据中的少数应用之一是[8],其中创建了几个精心设计的功能,包括价格Delta、买卖价差以及价格和数量价差。然后,使用所有手工制作的特征对SVM进行训练,以预测未来中等价格变动的方向。在文献[28]中,结合双线性投影和时间注意机制的思想的神经网络架构被用于预测LOB中间价。类似地,在[29,30]中,利用限额订单数据以及ML方法,如多线性方法和智能特征选择,预测未来的价格变动。

8
nandehutu2022 在职认证  发表于 2022-6-11 00:26:38
在我们之前的工作【31,9,32】中,我们介绍了一个大规模高频限购簿数据集,即本文中使用的lso,我们使用了三个简单的DL模型,即卷积神经网络(CNN)、长短时记忆递归神经网络(LSTM RNNs)和神经袋特性(N-BoF)模型,来解决预测中间价变动的问题。然而,这些方法直接使用了非静态的原始订单数据,这使得它们很容易受到分布变化的影响,并损害了它们对看不见数据的概括能力,正如我们在本文中的实验所示。据我们所知,这是首次提出一种结构化方法,用于从限额订单中提取固定价格特征,该方法可以有效地与深度学习模型相结合。我们还对一个包含400多万个事件的大规模数据集上提出的方法进行了广泛的评估。此外,还提出了一个强大的模型,该模型将神经网络特征提取特性与LSTM的时间序列建模功能相结合,以提高预测股票价格变动的准确性。还将所提出的组合模型与之前引入的使用所提出的平稳价格特征的方法进行了比较。3、限制订单簿数据在订单驱动的金融市场中,市场参与者可以下两种类型的买入/卖出订单。通过发布限额指令,交易员承诺以特定价格或更低(更多)购买(出售)一定数量的资产。限额订单簿对尚未执行或取消的有效限额订单进行提示。此限制订单簿(LOB)包含所有已提交且等待执行的现有买卖订单。

9
能者818 在职认证  发表于 2022-6-11 00:26:41
在给定的价格水平下,限额订单被放置在队列中,在标准限额订单的情况下,给定价格水平下的执行优先级由到达时间(输入、输出)决定。市场订单是指以限额订单簿中的最佳可用价格立即购买/出售一定数量资产的订单。如果alimit订单的等额价格远未达到最佳价格,则可能需要很长时间才能执行限额或de r,在这种情况下,交易方最终可以取消订单。订单分为买卖双方。每一方都包含按其优先级排序的订单,投标方的降序和要求方的升序。按照【5】中使用的符号,价格g rid定义为{ρ(1)(t),…,ρ(n)(t)},其中ρ(j)(t)>ρ(i)(t)表示所有j>i。价格网格包含所有可能的价格,每个连续的价格水平比之前的价格水平增加一个刻度。订单簿的状态是一个连续的时间过程v(t)≡v(1)(t),v(2)(t),v(n)(t)t型≥0,其中| v(i)(t)|是价格ρ(i)(t)下的剩余限额订单数量,1≤ 我≤ n、 如果v(i)(t)<0,则-v(i)(t)投标订单价格ρ(i)(t);如果v(i)(t)>0,则有v(i)(t)以价格ρ(i)(t)询价。也就是说,v(i)(t)>0表示订单,v(i)(t)<0表示投标订单。价格格中最佳报价的位置定义为:i(1)a(t)=inf{i=1,…,n;v(i)(t)>0},相应地,最佳投标价格的位置定义为:i(1)b(t)=sup{i=1,…,n;v(i)(t)<0}。为简单起见,我们将最佳买卖价格表示为p(1)a(t)≡ ρ(i(1)a(t))(t)和p(1)b(t)≡ρi(1)b(t)(t) ,分别为。

10
nandehutu2022 在职认证  发表于 2022-6-11 00:26:44
请注意,如果账簿中没有询价(投标)订单,则询价(投标)价格未定义。更一般地说,考虑到存在第k个最佳买卖价格,其位置表示为asi(k)a(t)≡ ia(t)+k-1和i(k)b(t)≡ ib(t)+k-1、第k个bes t询价和投标价格相应地表示为p(k)a(t)≡ ρ(i(k)a(t))(t)和p(k)b(t)≡ ρi(k)b(t)(t) ,分别为。相应地,我们用ν(k)a(t)表示第k个最佳询价和投标级别的未完成限额订单数量≡ v(i(k)a(t))(t)和ν(k)b(t)≡ vi(k)b(t)(t) ,分别为。限额订单簿数据可用于各种任务,如估计未来价格趋势或回归有用指标,如价格波动率。其他可能的任务可能包括早期预测异常事件,如价格的外部变化,这可能表明市场操纵。这些例子是多个应用中的一部分,当市场存在不利条件时,这些应用可以帮助投资者保护他们的资本,或者在其他情况下,利用这些不利条件进行投资。大多数利用自然时间序列数据的现代方法都采用了二次抽样技术,如著名的OHLC(开放-高-低-关闭)蜡烛[33],以减少每个时间间隔的特征数量。虽然OHLC c andles保留了有用的信息,如特定区间内的市场趋势和移动范围,但它删除了可能重要的微观结构信息。由于LOB不断以不一致的间隔接收新的顺序,因此不可能以保留其包含的所有信息的方式对其时间间隔特征进行二次采样。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 21:04