楼主: mingdashike22
2940 43

[量化金融] 股票价格跳跃到达的预测:基于新注意的 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8216
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-6-25 04:11:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Forecasting of Jump Arrivals in Stock Prices: New Attention-based
  Network Architecture using Limit Order Book Data》
---
作者:
Ymir M\\\"akinen, Juho Kanniainen, Moncef Gabbouj, Alexandros Iosifidis
---
最新提交年份:
2018
---
英文摘要:
  The existing literature provides evidence that limit order book data can be used to predict short-term price movements in stock markets. This paper proposes a new neural network architecture for predicting return jump arrivals in equity markets with high-frequency limit order book data. This new architecture, based on Convolutional Long Short-Term Memory with Attention, is introduced to apply time series representation learning with memory and to focus the prediction attention on the most important features to improve performance. The data set consists of order book data on five liquid U.S. stocks. The use of the attention mechanism makes it possible to analyze the importance of the inclusion limit order book data and other input variables. By using this mechanism, we provide evidence that the use of limit order book data was found to improve the performance of the proposed model in jump prediction, either clearly or marginally, depending on the underlying stock. This suggests that path-dependence in limit order book markets is a stock specific feature. Moreover, we find that the proposed approach with an attention mechanism outperforms the multi-layer perceptron network as well as the convolutional neural network and Long Short-Term memory model.
---
中文摘要:
现有文献证明,限价指令簿数据可用于预测股票市场的短期价格变动。本文提出了一种新的神经网络结构,用于预测股票市场中高频极限订单数据的收益跳跃到达。这种新的体系结构基于带注意的卷积长短时记忆,用于应用带记忆的时间序列表示学习,并将预测注意力集中在最重要的特征上,以提高性能。该数据集包括五只流动美国股票的订单数据。使用注意机制可以分析包含限制订单簿数据和其他输入变量的重要性。通过使用这一机制,我们提供了证据,证明使用限额订单数据可以明显或轻微地改善所提出模型在跳跃预测中的性能,具体取决于基础股票。这表明限价订单市场的路径依赖是股票特有的特征。此外,我们发现,所提出的具有注意机制的方法优于多层感知器网络、卷积神经网络和长-短期记忆模型。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--

---
PDF下载:
--> Forecasting_of_Jump_Arrivals_in_Stock_Prices:_New_Attention-based_Network_Archit.pdf (608.8 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:股票价格 注意的 Architecture Quantitative Presentation

沙发
可人4 在职认证  发表于 2022-6-25 04:11:57
股票价格跳涨预测:使用极限订单数据的基于新注意力的网络架构,*, Moncef Gabbouja,Alexandros Iosi芬兰坦佩雷理工大学信号处理研究所。芬兰坦佩雷理工大学工业和信息管理实验室。C丹麦奥胡斯大学工程、电气和计算机工程系现有文献证明,限价订单数据可用于预测股票市场的短期价格变动。本文提出了一种新的神经网络结构,用于预测具有高频有限订单数据的股票市场中的收益跳跃到达。这种新的体系结构基于带注意的卷积长短时记忆,用于应用带记忆的时间序列表示学习,并将预测注意力集中在最重要的特征上,以提高性能。该数据集包括五只流动美国股票的订单数据。使用注意机制可以分析inclusionlimit订单簿数据和其他输入变量的重要性。通过使用这种机制,我们提供了证据,证明使用限价订单数据可以明显或轻微地改善所提出模型在跳跃预测中的性能,具体取决于基础股票。这表明限价订单市场中的路径依赖是一个特殊的特征。此外,我们发现,所提出的具有注意机制的方法优于多层感知器网络、卷积神经网络和长短期记忆模型。关键词:跳跃,极限订单书数据,神经网络,卷积网络,长-短期记忆,注意机制1。

藤椅
nandehutu2022 在职认证  发表于 2022-6-25 04:12:00
简介如今,许多交易所,如纽约证券交易所(NYSE)和各种纳斯达克交易所,都在使用由提交限额指令驱动的系统。Limitorders是向系统提交的文件,其中包含要购买或出售的价格和所需数量。限价订单簿(LOB)市场的运行频率非常高,对于位于该市场的机器,延迟通常从毫秒到几纳秒不等*相应的authorEmail地址:(Ymir M–akinen),juho。kanniainen@tut.fi(Juho Kanniainen),moncef。gabbouj@tut.fi(Moncef Gabbouj),亚历山德罗斯。iosifidis@eng.au.dk(Alexandros Iosi fidis)预印本于2021年9月17日在交易所附近提交给arXiv。这一点以及从交易所获取事件数据的可能性,产生了大量数据,为数据处理创造了新的机会。这使得对许多有趣问题的市场分析达到了一个全新的水平(例如,见Toth et al.,2015;Chiarella et al.,2015),但也给理论和计算方法带来了独特的挑战(Cont,2011)。在最近的文献中,引入了可处理模型和数据驱动方法,即机器学习来预测LOB数据的价格变动(Cont et al.,2010;Cont,2011;Cont和De Larrard,2012;Kercheval和Zhang,2015;Ntakaris et al.,2018;Tsantekidis et al.,2017b,a;Passalis et al.,2017;Dixon,2018;Tran et al.,2018;Sirignanoand Cont,2018)。总体而言,现有文献提供的证据表明,限价订单账簿数据可用于预测股票市场的价格变动。尽管通常使用LOB数据预测股票价格变动,但关于使用LOB数据预测股价上涨的研究较少。

板凳
能者818 在职认证  发表于 2022-6-25 04:12:03
股票价格上涨是价格路径上的显著不连续性,因此当时实现的回报远大于通常的持续创新。在文献中,有强有力的实证证据表明股票市场存在收益跳跃(参见,例如,Eraker,2004;Lee,2012;Yang和Kanniainen,2017,以及其中的参考文献)。从经济上讲,回报率的跳跃反映了信息的到达(Lee,2012;Bradley等人,2014;Kanniainen和Yue,2017),因此,股价的跳跃也与信息发布的可预测性有关。此外,收益跳跃在期权定价中至关重要(Cont和Tankov,2003)。这项工作解决的主要研究问题如下:利用高频极限订单(LOB)数据和先进的机器学习技术,可以预测股票收益率的跳跃幅度有多大?随之而来的问题是,订单数据中是否可以预见价格上涨。这些问题的动机是,做市商,即流动性提供者,可以事先获得关于即将到来的预定或非预定新闻的信息,这些信息将作为大幅度的价格波动实现,并与做市商对抗。成熟的做市商不想提供流动性,因为限额指令可以理解为以给定价格交易标的证券的期权,并且可以避免逆向选择(见Copeland和Galai,1983)。正如福柯等人(2007)所言,如果限价单在新信息到达后变得过时,投机者可能会行使这些选项,即选择限价单。因此,成熟的做市商不想冒这样的风险,即在价格上涨后,他们的限价指令出现在账簿错误的一侧,被快速交易商利用,这被视为低限价指令账簿流动性Siikanen et al.(2017)。

报纸
何人来此 在职认证  发表于 2022-6-25 04:12:07
此外,如果做市商不仅能够预测未来涨势的位置,还能够预测未来涨势的方向,那么限价指令簿可能会变得不对称缺乏流动性。这种情况如图1所示,图1显示了2014年6月9日苹果的订单价格中间价出现了大幅上涨,在上午9:33-9:34之间检测到了积极的上涨。该图提供了1分钟跳转间隔开始前1分钟和1秒的快照,以及相同1分钟跳转间隔结束后1秒的第三个快照图。它表明了以下几点:–在跳跃间隔开始前1分钟:订单簿是对称的,虽然很薄(薄且广泛),但按市场顺序交易大量股票相对昂贵跳转间隔开始前1秒:订单簿变得不对称,所以订单簿在ask端流动性非常低,而在bid端流动性相对较高。这可能意味着流动性提供者有一种预感,即将出现正的中间价上涨。在这种情况下,即使是askside的小额交易也会导致价格大幅上涨跳转间隔结束后1秒(间隔开始后1分1秒):提供的流动性在ask端恢复,ask端流动性恢复。100000 0 10000Quantity92.292.492.692.893.093.2Price-1 min100000 0 10000Quantity92.292.492.893.093.2Price-1 s100000 0 10000Quantity92.292.492.692.893.093.2Price+1分钟s图1:2014年6月9日苹果订单上的三个快照,大约在上午9:33-9:34之间检测到跳跃。左侧的曲线图显示了上午9:32跳转间隔开始前一分钟订单簿的状态。中间的一个图显示了上午9:29:59时间隔开始前一秒的订单簿状态。

地板
能者818 在职认证  发表于 2022-6-25 04:12:10
右侧的第三个绘图在上午9:34:01am间隔结束后第二秒绘制订单簿。数量为零的红线左侧包含投标(即投标订单显示为负数量),称为本书的投标侧,右侧包含询价(即正数量),称为询价侧。黑色虚线表示中间价格。数据由纳斯达克美国提供。这个例子也回避了关于根本原因的问题:如果做市商基于市场基本面预期价格上涨,从而在风险方没有提供流动性,或者,如果价格波动是由微观结构噪音引入的,那么在风险方的订单簿流动性不足不是基于市场基本面。在本文中,我们保持这两种解释都是可能的。事实上,根本原因是相当不相关的——本文的目的是建立神经网络模型来预测价格上涨,从而回答订单数据中是否可以预见价格上涨的问题,这是根本原因之一还是其他原因。在方法论上,我们有两类预测问题:在下一分钟内是否有一个跳跃。输出数据包括对检测到的股价跳跃的位置和迹象的逐分钟观察。输入数据从重构的订单簿中提取。我们不仅使用“原始”数据,即不同级别的价格和数量,还使用从过去120分钟的毫秒级观测中提取的手工特征。关于跳跃,本文遵循现有文献,将跳跃定义为无法用布朗运动解释的大型价格运动。作为初步步骤,使用的非参数jumpdetection检验(Lee和Mykland,2008)从高频中等价格数据中检测返回跳跃的位置。

7
大多数88 在职认证  发表于 2022-6-25 04:12:13
然后,在对限额订单数据进行预处理后,利用高频限额订单数据的实时特征,应用各种神经网络方法预测跳跃的位置。在本文中,机器学习是指一组具有学习特性的方法,它允许系统自行调整参数。不同的机器学习方法,尤其是神经网络,在20世纪50年代首次引入(Rosenblatt,1957),在过去十年中变得越来越流行。神经网络已被证明是时间序列预测中极为成功的少数方法之一(Graves,2012),尽管金融时间序列通常被认为很难预测(Kara et al.,2011)。在本文中,我们不仅使用了标准的多层感知器网络(MLP),还使用了卷积神经网络(CNN)和长-短期记忆(LSTM)网络,这两种网络在预测股价波动方面都非常成功(Tsantekidis et al.,2017b,a)。此外,通过结合卷积和长短时记忆(LSTM)层以及Zhou等人(2016)提出的注意模型,开发了一种新的网络模型。提出的卷积LSTM注意模型(CNN–LSTM–attention)旨在利用LSTM进行时间序列记忆、卷积(CNN)和注意力模型,以减少输入大小,增加局部性,并关注最重要的特征以改进预测结果。除了上述主要问题外,我们还考虑哪种方法(MLP、CNN、LSTM、CNN LSTM Attention)最适合用LOB数据预测跳跃。

8
可人4 在职认证  发表于 2022-6-25 04:12:16
提议的CNN LSMattention网络的性能尤其令人感兴趣,因为它提供了一种新的方法组合,这些方法针对跳跃预测进行了联合优化。为了分析所选网络的可预测性和性能,我们使用了来自纳斯达克几只顶级股票的高频LOB数据集来训练和测试所提出的方法。使用的股票有谷歌(GOOG)、微软(MSFT)、苹果(AAPL)、英特尔(INTC)和Facebook(FB)。论文的其余部分组织如下。第2节介绍了输出(检测到的跳转位置)和输入数据(实时订单功能)。然后,第3节介绍了本文使用的网络模型,包括称为CNN LSTM注意模型的新网络架构。第4节提供了实证结果,最后,第5节总结了这项工作。2、数据2.1。数据集本研究使用纳斯达克的“TotalView ITCH”限额订单数据进行。数据由超高频(毫秒)信息组成。我们强调,建议的方法适用于任何有限价订单账簿数据的证券。同时,这些方法不适用于预测外汇市场(Bates,1996)和其他没有公开此类限额指令簿的市场的跳跃,也不适用于分析与实际投资(Dixit et al.,1994;Kanniainen,2009)或其价值过程不可观察的其他资产相关的过程。通过纳斯达克系统执行的限价指令、取消和交易。这些数据包含订单的价格和数量,以及与之相关的部分和全部交易和取消。这些数据进一步转换为两个数据集:(i)输出数据:关于检测到的股价跳跃的逐分钟数据。

9
kedemingshi 在职认证  发表于 2022-6-25 04:12:19
这是基于检测到跳跃的中间价格观察,因此每一分钟都被划分为有跳跃或无跳跃。(ii)关于订单簿状态的逐事件输入数据。这些数据是从有关订单簿事件的毫秒级观察中提取的。结果数据包含书籍两侧十个最佳级别的出价和要价及其数量。订单驱动的市场系统的工作方式是,投资者可以根据自己想要的价格下eitherask或出价订单,并且该系统将匹配合格的订单来创建交易。订单可以是限制订单或市场订单。限价订单以特定价格列入订单列表。如果存在最低价的限价订单,则立即执行市场订单。在某种程度上,这类似于排队系统,尤其是当提交相同价格的订单时。尚未执行的限额订单也可以随时取消。交易和取消也可以是部分的,这意味着限额指令的一部分将在执行后留在账簿中(Cont et al.,2010)。股票订单交易取消SAAPL 1963.37 181.33 1870.52FB 1665.53 136.32 1563.80INTC 848.58 71.38 823.11MSFT 1304.75 95.22 1272.25GOOG 480.34 27.86 462.20表1:一分钟内每只股票的订单提交、交易和取消的平均数量。交易和取消还包括部分执行和订单取消。为了确保连续的订单流量,本研究选择了几个知名的液体库存。他们是谷歌(GOOG)、微软(MSFT)、苹果(AAPL)、英特尔(INTC)和Facebook(FB)。所有选定的股票每天都有大量订单和交易。表1显示了一分钟内订单提交、取消和交易的平均数量。数据分为两类:训练数据和测试数据。

10
nandehutu2022 在职认证  发表于 2022-6-25 04:12:22
训练数据是用来学习问题的数据,即在训练阶段将数据反馈给网络,通过优化算法调整权重。培训数据包括五天内的一系列观察结果。AAPL 15%的价格数据略有调整。2014年6月6日下午5点,苹果发行了108000000股新股,有效地将现有普通股拆分为七部分。由于这是在观察期的中间,并且个人投资者的财富在持有股票方面没有差异,因此分割之前的所有股票价格都除以7,以使持有股票的真实价值保持连续。在开始模型培训之前,将选择培训数据作为验证数据。验证和测试数据旨在评估系统的性能。这不能仅用训练数据来完成,因为模型很容易被过度拟合,这会严重降低训练数据集之外的性能,因为训练模型不再具有普遍性(Webb和Copsey,2011)。测试和验证数据之间的区别在于,在培训阶段,验证数据经常用于模型选择和调整。选择最佳模型后,使用测试数据评估模型的性能。因此,验证数据与测试数据分开保存,以确保模型的开发不仅仅是为了能够对测试数据进行分类;此外,这为系统的性能提供了客观的观点。在所有数据集中,每分钟都会采集一次观测值,但通过复制跳跃观测值,跳跃样本的数量会增加。具体而言,重复样本的开头会移动几秒钟,以确保没有相同的样本。数据集的时间间隔如表2所示。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 22:50