楼主: 可人4
1132 31

[量化金融] 基于递归神经网络的极限订货簿序列分类 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
48.9243
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-6-1 04:01:37 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Sequence Classification of the Limit Order Book using Recurrent Neural
  Networks》
---
作者:
Matthew F Dixon
---
最新提交年份:
2017
---
英文摘要:
  Recurrent neural networks (RNNs) are types of artificial neural networks (ANNs) that are well suited to forecasting and sequence classification. They have been applied extensively to forecasting univariate financial time series, however their application to high frequency trading has not been previously considered. This paper solves a sequence classification problem in which a short sequence of observations of limit order book depths and market orders is used to predict a next event price-flip. The capability to adjust quotes according to this prediction reduces the likelihood of adverse price selection. Our results demonstrate the ability of the RNN to capture the non-linear relationship between the near-term price-flips and a spatio-temporal representation of the limit order book. The RNN compares favorably with other classifiers, including a linear Kalman filter, using S&P500 E-mini futures level II data over the month of August 2016. Further results assess the effect of retraining the RNN daily and the sensitivity of the performance to trade latency.
---
中文摘要:
递归神经网络(RNN)是一种非常适合预测和序列分类的人工神经网络(ANN)。它们已被广泛应用于预测单变量金融时间序列,但其在高频交易中的应用尚未被考虑。本文解决了一个序列分类问题,在该问题中,使用对限价指令簿深度和市场订单的短序列观察来预测下一事件的价格翻转。根据该预测调整报价的能力降低了不利价格选择的可能性。我们的结果表明,RNN能够捕捉短期价格波动与限价订单簿时空表示之间的非线性关系。RNN在2016年8月使用S&P500 E-mini期货二级数据,与其他分类器(包括线性卡尔曼滤波器)相比,具有优势。进一步的结果评估了每天重新训练RNN的效果以及性能对交易延迟的敏感性。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--

---
PDF下载:
--> Sequence_Classification_of_the_Limit_Order_Book_using_Recurrent_Neural_Networks.pdf (609.57 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:神经网络 神经网 observations Presentation relationship

沙发
大多数88 在职认证  发表于 2022-6-1 04:01:42
使用递归神经网络对限额订单簿进行序列分类matthew Dixon11Stuart商学院,伊利诺伊州芝加哥市西35街10号伊利诺伊理工学院,邮编60616,matthew。dixon@stuart.iit.eduJuly14,2017抽象递归神经网络(RNN)是一种非常适合预测和序列分类的人工神经网络(ANN)。它们已被广泛应用于预测单变量金融时间序列,但它们在高频交易中的应用之前并未被考虑。本文解决了一个序列分类问题,其中使用对限价订单簿深度和市场订单的短序列观察来预测下一事件的价格波动。根据这种预测调整报价的能力降低了不利价格选择的可能性。我们的结果表明,RNNto能够捕捉短期价格波动和限价订单簿时空表示之间的非线性关系。使用2016年8月的S&P500 E-mini期货二级数据,RNN与其他分类工具(包括线性卡尔曼滤波器)相比,具有优势。进一步的结果评估了每天重新培训RNN的效果以及性能对交易延迟的敏感性。关键词:递归神经网络、限价指令簿、期货市场。1引言金融计量经济学方法面临的许多挑战包括时间序列的非平稳性、非线性或噪声。人工神经网络(ANN)在多变量金融时间序列方法中的应用已得到充分证明(Faraway and Chat field,1998;Refenes,1994;Trippi and DeSieno,1992;Kaastra and Boyd,1995)。

藤椅
kedemingshi 在职认证  发表于 2022-6-1 04:01:45
他们倾向于过度匹配、趋同问题和难以实施,这引发了人们的担忧,阻碍了金融行业从业者在预测低频波动或价格变化时早期采用他们。时变信号的建模和分析是信号处理的一个重要子领域。经典卡尔曼滤波器(KF)是动态系统中最成功的算法之一。KFs属于贝叶斯滤波器家族,包括粒子滤波和隐马尔可夫模型。基本方法对时变线性系统的隐藏状态进行最小均方误差估计。有充分证据表明,卡尔曼滤波器非常适合预测低频单变量金融时间序列,即每天记录一次(Gultekinand Paisley,2017),甚至记录到一秒的分辨率。微结构效应开始在更高的频率(通常为亚毫秒级)控制信号。市场知识1ARXIV:1707.05642v1【q-fin.TR】2017年7月14日微观结构成为准确预测价格变动的基础,而时间序列预测的问题无法直接应用于时变信号的建模。现代金融交易所通过即时双重拍卖促进了工具的电子交易。在每个时间点,市场需求和供应都可以通过电子限额订单簿来表示,这是一个以不同价格水平执行的订单横截面,远离市场价格。市场价格与其流动性密切相关,流动性是该工具可以立即转换为现金的因素。市场的流动性以其深度为特征,即关于市场价格的报价买入和卖出指令的总量。

板凳
mingdashike22 在职认证  发表于 2022-6-1 04:01:48
市场的流动性随着交易活动的变化而变化(Bloom field et al.,2005);在任何时间点,市场流动性的数量都可以通过账面深度的横截面来表征。流动市场对市场参与者具有吸引力,因为它们允许以最佳可用价格近乎即时地执行大宗交易,价格影响较小。然而,有时大型市场订单或一系列小型市场订单将消耗整个价格水平。这就是市场价格在流动性市场中波动的原因,这一影响通常被从业者称为“价格波动”。价格水平消费之后,买卖价差开始扩大,随着做市商的利用,买卖价差迅速恢复,从而形成新的中间价。然而,对于限价订单簿传达预测信息的程度,似乎没有达成共识。研究股票的早期开创性论文,包括Glosten(1994);Seppi(1997)指出,内幕市场以外的限价指令包含的信息很少。相比之下,其他几项研究表明,此类限额指令具有信息性(Palour,1998;Bloom fifield et al.,2005;Cao et al.,2009;Zheng et al.,2013;Kearns and Nevmyvaka,2013;Cont et al.,2014;D.andPollak,2014)。特别是,Cao等人(2009年)研究了澳大利亚证券交易所的限价指令书的信息内容。他们发现,该书对价格发现的贡献约为22%,而其余的贡献来自一级数据和交易价格。他们还表明,需求和供应之间的订单失衡与短期未来回报之间存在着统计学上的显著关系。

报纸
kedemingshi 在职认证  发表于 2022-6-1 04:01:51
越来越多的证据表明,微观结构研究对于发现长期关系甚至跨市场效应至关重要(Dobrislavand Schaumburg,2016)。许多数量,如限价指令状态下的价格变动概率,与交易和日内风险管理相关。订单账簿动态和价格变动之间的复杂关系一直是计量经济学和随机建模的重点(seeEngle和Russell(1998);Cont等人(2010年、2014年);Cont和de Larrard(2013年);查韦斯·卡西利亚斯和菲格罗亚·洛佩斯(2017)及其参考文献)。对于分析的可处理性,这些模型假设了一个数据生成过程,并且通常根据差异过程的渐近极限来估计数量。在马尔可夫环境下,并在进一步的建模假设下,如将市场订单的到达率视为泊松过程、同质订单规模以及取消和订单的独立性假设,推导出了上涨的概率。然而,这些建模假设可能太强,无法描述微观规模的书籍动态(sub1ms)。在这种规模下,价格不是马尔可夫的,增量既不是独立的,也不是固定的,取决于订单簿的状态。放松马尔可夫假设的尝试,例如使用“重交易”近似方法(Cont和de Larrard,2010;Chavez Casilland Figueroa Lopez,2017)最适合于价格变动的中尺度分析,而非微观尺度分析。在Cont和de Larrard(2013)的简化订单簿模型的指导下,我们的方法选择了相似的外部变量。特别是,我们将每个价格水平下的队列大小视为独立变量。此外,我们还包括市场订单的属性,尽管我们观察到其形式与预测价格变动的方向最相关。

地板
nandehutu2022 在职认证  发表于 2022-6-1 04:01:54
与托卡斯特模型形成鲜明对比的是,我们没有对独立变量(又称特征)施加条件分布假设,也没有假设价格变动是马尔可夫的。上述大多数预测建模研究都依赖于回归,以解释流动性对连续成交量加权平均价格(VWAP)的解释力,即“智能价格”。智能价格对高频交易的效用有限。所谓的“做市商”在市场双方都提供限价订单报价,试图抓住价差。他们无法通过调整报价先发制人,通常会导致不利的价格选择和利润损失。智能价格的变化并不意味着价格波动。例如,最佳投标数量的变化将导致智能价格的变化,但不一定会导致中间价格的变化,后者的影响归因于来自传入市场订单的价格水平消耗。因此,成功预测价格波动,而不是智能价格的变化,可以直接用于避免不利的价格选择。传统的建模技术依赖于即时的市场内部流动性失衡,难以捕捉到涨跌数据中突然出现的价格波动。Breiman(Breiman,2001)在从数据得出结论时描述了统计建模的两种文化。一种假设数据生成过程,后者使用算法模型,将数据机制视为未知。机器学习属于简化模型估计过程的算法类。它的目的是在输入和输出变量之间的关系为非线性且输入空间通常为高维的复杂环境中提供预测。

7
大多数88 在职认证  发表于 2022-6-1 04:01:57
许多研究人员已经将机器学习方法应用于极限订单书动力学的研究(Kearns和Nevmyvaka,2013;Kercheval和Zhang,2015;Sirignano,2016;Dixon等人,2017)。本文采用一种算法方法,通过观察限价订单簿深度和市场订单的短序列来预测下一个事件的价格波动。我们选择限制订单簿的时空表示(Sirignano,2016;Dixon et al.,2017)与市场订单历史相结合作为预测因素。我们的方法解决了一个序列分类问题,在该问题中,对书籍深度和市场订单的短期观察序列可以分类为方向性中间价格变动。序列分类为市场参与者带来潜在的重大利益。例如,做市商可以利用评级机构不断调整报价,从而潜在地降低不利价格选择的可能性。文献中还考虑了序列分类,以根据历史价格预测低频价格变动(Leunget等人,2000年;Dixon等人,2016年)。因此,我们的方法的新颖之处在于将递归神经网络分类器应用于限价订单账簿的时空表示,并结合市场订单历史,以预测价格波动。本文的主要贡献是描述和证明了递归神经网络对金融期货限价指令簿中的短期价格变动进行分类的潜力。可以使用随机梯度下降法(SGD)来训练递归神经网络结构,该方法学习层间结构中的权重和效用集。辍学(DO)执行变量选择(Srivastava等人,2014)。

8
大多数88 在职认证  发表于 2022-6-1 04:02:00
RNN依靠适量的训练时间序列数据以及灵活的体系结构来“匹配”样本内和样本外的性能,这些性能通过平均误差、曲线下面积(AUC)或F1分数来衡量,F1分数是精确度和召回率的调和平均值。我们的性能结果表明,RNN能够捕捉短期价格波动和有限订单的时空表示之间的非线性关系。本文的其余部分概述如下。第2节介绍了sequencelearning和RNN体系结构。第2.3节描述了构建RNN所需的培训、验证和测试过程。第3节描述了高频分类问题,并给出了从marketdata提要中提取的限额订单簿变量的时空公式。第4节描述了使用RNNto捕捉中间价格的不连续性,与适用于分类的卡尔曼滤波方法和使用S&P500 E-mini II级期货数据的逻辑回归相比,经验收益的实现和量化。RNN在时空特征集上与其他分类器进行了比较。我们进一步评估了RNN在整个日历月内的鲁棒性和稳定性,在任何一天,RNN都可能做出数百万次预测。特别是,我们描述了每日重新培训RNN的效果以及它对交易平台和交易所之间延迟的敏感性。第5节结束。32机器学习机器学习解决了一个基本的预测问题:在给定高维输入矩阵X=(X(1),…)的情况下,为输出Y构造一个非线性预测器Y(X),P变量的X(P))。机器学习可以简单地看作是研究和构建形式为y=F(X),其中X=(X(1)。

9
nandehutu2022 在职认证  发表于 2022-6-1 04:02:03
,X(P))。输出变量Y可以是连续的、离散的或混合的。例如,在一个分类问题中,F:X→ Y其中Y∈ {1,…,K},K是类别数。当Y是一个连续向量,f是一个半函数时,如果输入输出对D={Xt,Yt}Nt=1是X和Y在时间t=1,…,的自相关观测值,则我们恢复线性模型Y=AX+b.2.1序列学习,N、 然后,基本预测问题可以表示为序列预测问题:使用T长度子序列X的高维输入矩阵X:Y=F(X),其中Xt=seqT(Xt)=(Xt),构造输出Y的非线性时间序列预测器^Y(X-T+1,Xt)其中Xt-jis对Xt、Xt的JTH标记观察-j=Lj【Xj】,对于j=0,T- 因此,Sequencelearning只是一个非线性映射和滞后输入变量向量化的组合。如果数据是i.i.d.,则不需要序列(即T=1),我们恢复标准预测问题。2.2递归神经网络(RNN)RNN是序列学习者,在自然语言理解、语言生成、视频处理和许多其他任务Graves(2013)等应用中取得了巨大成功。为了符号的简洁,我们将集中讨论简单的RNN模型。简单的RNN是通过对输入序列XT=(X1,…,XT)重复应用函数fhn而形成的。对于每个时间步t=1,T,函数从当前输入XT和先前输出ht生成隐藏状态ht-1: 对于某些非线性激活函数σ(x),ht=Fh(Xt,ht1)=σ(WhXt+uht1+bh),(1)。如图1所示,这个简单的RNN是一个单隐层神经网络(又称Elman网络(Elman,1991))在所有时间步长上的折叠。4h1t-5hjt-5hHt-5Xt-5h1t-4hjt-4小时-4Xt-4h1t-3hjt-3小时-3Xt-3h1t-2hjt公司-2小时-2Xt-2h1t-1hjt-1hHt-1Xt-1h1thjthHtXtYt。

10
mingdashike22 在职认证  发表于 2022-6-1 04:02:07
. . .图1:一个带有一个隐藏层的递归神经网络的示例,在六个时间步序列上展开。每个输入Xt的顺序为Xt。隐藏层包含Hunits,时间步长t处的jthoutput由hjt表示。隐藏单元之间的连接是循环的,并由矩阵Wh加权。在最后的时间步骤t,隐藏单元用K个输出向量中的1个y连接到K个单元输出层。当输出是连续的时,最终隐藏状态的模型输出Y=Fy(hT)由半函数给出:Y=Fy(hT)=WyhT+by,(2)当输出是分类的时,输出由Y=Fy(hT)=softmax(Fy(hT)),(3)其中Y具有“一个热”编码-在单个位置具有1的零的K向量。这里W=(Wh,Uh,Wy)和b=(bh,by)分别是权重矩阵和off集。世界卫生组织∈ RH×Pdenotes输入XT和H隐藏单元之间非重复连接的权重。隐单元之间的递归连接的权重由递归权重矩阵xuh表示∈ RH×H。如果没有这样的矩阵,该体系结构只是一个没有内存的展开单层前馈网络,每个观测XT被视为一个独立的观测。WY表示在最后一个时间步ht和输出层与隐藏单元的输出相关的权重。如果输出变量是连续向量,则Y∈ RMthen Wy∈ RM×H。如果输出是分类的,有K个状态,那么Wy∈ RK×H。RNN设计中存在许多问题。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 08:00