楼主: 大多数88
1024 13

[量化金融] 基于深度学习的中间价预测特征工程 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
70.8997
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-6-14 11:29:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Feature Engineering for Mid-Price Prediction with Deep Learning》
---
作者:
Adamantios Ntakaris, Giorgio Mirone, Juho Kanniainen, Moncef Gabbouj,
  Alexandros Iosifidis
---
最新提交年份:
2019
---
英文摘要:
  Mid-price movement prediction based on limit order book (LOB) data is a challenging task due to the complexity and dynamics of the LOB. So far, there have been very limited attempts for extracting relevant features based on LOB data. In this paper, we address this problem by designing a new set of handcrafted features and performing an extensive experimental evaluation on both liquid and illiquid stocks. More specifically, we implement a new set of econometrical features that capture statistical properties of the underlying securities for the task of mid-price prediction. Moreover, we develop a new experimental protocol for online learning that treats the task as a multi-objective optimization problem and predicts i) the direction of the next price movement and ii) the number of order book events that occur until the change takes place. In order to predict the mid-price movement, the features are fed into nine different deep learning models based on multi-layer perceptrons (MLP), convolutional neural networks (CNN) and long short-term memory (LSTM) neural networks. The performance of the proposed method is then evaluated on liquid and illiquid stocks, which are based on TotalView-ITCH US and Nordic stocks, respectively. For some stocks, results suggest that the correct choice of a feature set and a model can lead to the successful prediction of how long it takes to have a stock price movement.
---
中文摘要:
由于LOB的复杂性和动态性,基于LOB数据的中间价变动预测是一项具有挑战性的任务。到目前为止,基于LOB数据提取相关特征的尝试非常有限。在本文中,我们通过设计一组新的手工特征并对流动和非流动股票进行广泛的实验评估来解决这个问题。更具体地说,我们实现了一组新的计量经济学特征,这些特征捕获了基础证券的统计特性,用于中期价格预测任务。此外,我们还开发了一个新的在线学习实验协议,该协议将任务视为一个多目标优化问题,并预测i)下一次价格变动的方向,以及ii)在发生变化之前发生的订单事件的数量。为了预测中期价格变动,将这些特征输入到九种不同的深度学习模型中,这些模型基于多层感知器(MLP)、卷积神经网络(CNN)和长-短期记忆(LSTM)神经网络。然后,分别以TotalView ITCH美国和北欧股票为基础,对流动性股票和非流动性股票的绩效进行评估。对于一些股票,结果表明,正确选择特征集和模型可以成功预测股价波动所需的时间。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--

---
PDF下载:
--> Feature_Engineering_for_Mid-Price_Prediction_with_Deep_Learning.pdf (3.37 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:深度学习 中间价 学习的 Experimental Applications

沙发
大多数88 在职认证  发表于 2022-6-14 11:29:19
深度学习Adamantios Ntakarisa的中等价格预测功能工程,*, 乔治·米罗内布,*, Juho Kanniainna、Moncef Gabbouja、Alexandros Iosi信息技术和通信科学研究所、坦佩雷大学、Korkeakoulunkatu 1、FI-33720、坦佩雷、芬兰巴丹马克国家银行、Havengade 5 1093 Kobenhavn K、哥本哈根、丹麦奥胡斯大学工程、电气和计算机工程系、芬兰斯加德22、Hangovej 2、,由于限价订单的复杂性和动态性,基于限价订单数据的DenmarkAbstractMid价格变动预测是一项具有挑战性的任务。到目前为止,基于限额订单簿数据提取相关特征的尝试非常有限。在本文中,我们通过设计一组新的手工特征并对流动和非流动股票进行广泛的实验评估来解决这个问题。更具体地说,我们提供了一组广泛的计量经济学特征,这些特征捕获了基础证券的统计特性,用于中期价格预测任务。实验评估包括与文献中的其他手工特征以及通过完全自动化过程从长-短期记忆自动编码器中提取的特征进行正面比较。此外,我们还开发了一种新的在线学习实验协议,将上述任务视为一个多目标优化问题,并预测i)下一次价格变动的方向,以及ii)在发生变化之前发生的订单事件的数量。为了预测中期价格变动,将特征输入到九种不同的深度学习模型中,这些模型基于多层感知器、卷积神经网络和长-短期记忆神经网络。

藤椅
可人4 在职认证  发表于 2022-6-14 11:29:22
然后在流动和非流动股票(即TotalView ITCH Us和Nordic股票)上评估拟议方法的性能。对于一些股票,结果表明,正确选择特征集和模型可以成功预测股价波动所需的时间。关键词:深度学习、计量经济学、高频交易、限价指令簿、中间价、美国数据1。金融市场的自动化增加了信息分析的复杂性。这种复杂性可以通过使用限额指令簿(LOB)等有序交易世界来有效管理。LOB是根据订单类型(即买卖双方)在价格水平上转换每日未执行交易活动的一种形式。日常交易活动是一个大数据问题,因为在一个交易日内会发生数百万个交易事件。每个交易环节的信息提取和数字信号(即时间序列)分析为机器学习(ML)交易者提供了关于订单、执行和取消交易的有用指示。传统的时间序列分析方法无法充分反映当代交易市场的复杂性。例如,[45]和[47]中的研究表明,与RIMA和GARCH模型相比,用于财务指标预测的经典机器学习和深度学习方法可以获得更好的结果。相反,机器和深度学习方法已被证明是时间序列分析和预测的非常有效的机制(例如,[14]、[39]、[49])。

板凳
kedemingshi 在职认证  发表于 2022-6-14 11:29:27
主要*相应的作者电子邮件地址:adamantios。ntakaris@tuni.fi(Adamantios Ntakaris),gmirone@econ.au.dk(Giorgio Mirone)免责声明:本文中表达的观点和结论仅为作者的观点和结论,不一定反映丹麦国家银行的观点。这些方法的优点是能够捕捉输入数据的非线性,并通过创建与建议问题更相关的新加权特征来连续过滤。尽管机器和深度学习方法在预测时间序列方面很有效,但它们主要是通过实证测试开发出来的。专注于DEP学习框架的大多数文献(例如,[55]、[19]、[25])仅依赖于原始数据或有限数量的特征。到目前为止,对于神经网络应该为中期价格预测任务分析的信息,人们关注得很少。在本文中,我们阐明了ML交易者在中期价格变动预测中应考虑利用的信息。为此,我们采用了大量的计量经济学特征进行中期价格预测,并与以下指标进行了正面比较:i)技术和定量分析(即[40]),ii)时间敏感和时间不敏感特征(即[31]和[41]),以及iii)通过全自动过程提取的特征。这一全自动特征提取过程由长短时记忆(LSTM)自动编码器(AE)执行。我们选择计量经济学作为我们手工制作特征的动机,因为它是金融工程领域,能够捕捉微观结构噪音和数据因果关系的经验证据。我们的数据伴随着价格的变化,在金融文献中被称为波动率,这是一种衡量我们手工制作的特性的指标。

报纸
kedemingshi 在职认证  发表于 2022-6-14 11:29:29
尽管学术文献普遍认为波动性本身不是影响股票回报的因素,但有充分的证据支持相反的观点。例如,在[26]中,作者发现波动性与数据中无法直接观察到的其他指标(如流动性溢价)一起影响股票回报。同样,Lettau和Ludvigson[34]提供的证据表明,消费与财富的比率会影响股票市场超额回报的信息,波动性解释了这些回报的重要部分。另一个例子是Chung和Chuwonganant的工作【17】,作者在这项工作中找到了强有力的证据,证明市场波动会影响个别股票的回报。在这种情况下,我们认为这些是将计量经济学视为中等价格变动预测任务的特征的可靠指标。我们根据最近提出的用于财务时间序列分析的深度学习模型进行分析。这些模型从多层感知器(MLP)到卷积神经网络(CNN)和类似LSTM的递归神经网络(RNN)。在我们的实验中,我们使用了来自美国和北欧股市的两个TotalView瘙痒数据集。我们根据两个协议制定了这些实验:第一个协议(即我们实验中的“协议i”)是首次在这里介绍的,并且基于在线学习。中间价变动的预测每发生一次,并被视为一个多目标优化问题,因为它可以预测中间价变动的时间和方向。第二个协议(即我们实验中的“协议II”)是基于Tsantekidis等人工作的现有协议。

地板
何人来此 在职认证  发表于 2022-6-14 11:29:32
【54】,根据这一点,每10天的中期价格变动预测被视为三类分类问题(即上升、下降或静态中期价格状态)。我们工作的主要贡献在于三大支柱。第一个支柱是利用广泛的计量经济学特征列表作为深入学习模型的输入,用于中等价格变动预测。第二个支柱是通过另外两个手工制作的功能集和一个基于全自动流程的功能集对新引入的功能进行广泛评估。我们对这些特征集进行afair评估,使用相同的九个流动性和非流动性股票的深度学习模型,以及不平衡和平衡的特征集。接下来,我们不仅对新引入的实验方案进行测试,还对北欧数据集(此处也使用)文献中建议的方案进行测试。我们的发现表明,手工制作的特征,其性能超过了完全自动化的特征提取过程(即基于LSTM AE),改变了高频交易的预测范围。更具体地说,目前的评估有助于交易员根据数据、库存和模型可用性选择合适的功能。最后,第三个支柱是指开发一种新的实验协议,该协议考虑到每个交易事件,并且不受高频数据中时间不规则性的影响。我们的工作建议根据库存和型号选择定制特征提取;类似的发现见【23】。计量经济学特征过去用于识别汇率波动的重大变化(即[56])或[62]中的破产预测等任务。目前的研究为其他一些应用开辟了道路。

7
mingdashike22 在职认证  发表于 2022-6-14 11:29:35
例如,可以对汇率或比特币价格预测等时间序列测试相同的功能集。此外,新引入的协议可以作为每个时间序列问题的基础,因为它是事件驱动的,不受时间不规则性的影响。最终,不需要任何类型的数据采样,即使对于数据集庞大的高频时间分辨率环境也是如此。论文的其余部分组织如下。我们在第二部分提供了全面的文献综述。第三节提供了问题陈述。第四节列出了手工制作的功能。第五节描述了我们分析中采用的各种深度学习模型,第六节描述了数据集和实验协议的详细信息。第七节给出了实证结果,第八节对本文进行了总结。附录中提供了我们实验中使用的计量经济学特征的详细描述,以及方案II的结果。2、文献综述高频LOB数据分析引起了机器学习社区的兴趣。流动数据的复杂性和混沌行为为非线性方法的使用提供了空间,就像我们在机器和深度学习中看到的那样。例如,Zhang等人[58]利用神经网络预测波罗的海干散货指数,并与计量经济模型进行了直接比较。作者在[48]中开发了一种新型的深层神经网络,用于捕捉aLOB的局部行为,用于空间分布建模。Dixon将RNN【20】应用于S&P500 E-mini期货数据,以进行价格变化预测等度量预测。Minh等人[38]还通过成功利用金融新闻和情绪词典,提出了短期股票预测的RNN架构。

8
大多数88 在职认证  发表于 2022-6-14 11:29:39
在[59]中,作者将基于CNN和RNN的组合神经网络模型应用于中期价格预测。指标预测,如中等价位,可以通过使用手工制作的功能来实现。手工制作的功能揭示了隐藏的信息,因为它们能够将时间序列信号转换为ML交易员有意义的交易指令。有几位作者朝着这个方向努力,如【31】、【43】、【41】、【51】、【50】、【60】和【48】。这些工作提供了一组有限的功能,从原始LOBdata到价格密度变化和不平衡量指标。Ntakaris等人提出了另一项提供广泛特征的工作。那里的作者根据大多数技术指标提取手工制作的特征,并基于LogisticRetression开发一个新的定量特征,该特征优于建议的特征列表。手工制作的功能只代表了寻求中等价格变动预测的实验协议的一部分。通过深度学习方法进行分类是机器学习协议的延续。许多作者利用金融文献中的深度学习解决了几个问题。例如,Alberg和Lipton[1]使用MLP和RNN预测公司未来的基本面。钱[45]利用机器和深度学习方法,如支持向量机(SVM)、MLP、去噪自动编码器(DAE)和组合DAE-SVM模型,预测股票指数价格的未来趋势。这些机器和深度学习模型优于传统的时间序列模型,如ARIMA和广义自回归条件异方差(GARCH)。Sezer等人。【46】使用MLP和三个最常用的技术指标作为股票价格变动预测的输入。许多作者利用LOB数据作为模型的输入。

9
可人4 在职认证  发表于 2022-6-14 11:29:42
例如,Nousi等人[39]研究了几种机器学习方法的性能,如自动编码器(AE)、特征袋算法、单隐层前馈神经网络(SLFN)和用于中间价格预测的MLP。Han等人【27】将决策树应用于LOB数据,并在中等价格预测问题上优于支持向量机(SVM)。在同样的方向上,文献[30]中的作者对市场订单数据应用了类似的方法来预测市场走势。Doering等人【21】基于深度学习架构,利用事件流量和限制订单数据集进行价格趋势和价格波动预测。Makinen等人[37]使用LSTM预测价格上涨,其中输入数据基于LOB数据。在神经模型方面,类似的工作在【53】中进行,以预测LOB的中间价格。据我们所知,这是第一次提出基于高频LOB数据的大量经济计量特征列表,作为多个神经网络的输入,用于中期价格预测。我们对最先进的手工制作功能与基于全自动流程的功能进行了正面比较;最后,我们报告了从两个高频数据集中提取的结果,其中包括两个美国和五个北欧股票的平衡集和非平衡集。3、问题陈述所考虑的问题是基于高频LOBdata的中间价格变动预测。更具体地说,我们使用消息和限制订单簿作为建议功能的输入。如表1所示,消息簿(MB)包含每次事件发生时发生的信息流。

10
可人4 在职认证  发表于 2022-6-14 11:29:45
每个传入事件显示的信息包括订单、执行或取消的时间戳、交易id、价格、数量、事件类型(即订单、执行或取消)以及事件的侧面(即询问或出价)。LOB(表2)根据交易系统交易所的运作,在特定规则下工作。时间戳Id价格数量事件侧1275386347944 6505727 126200 400取消Ask1275386347981 6505741 126500 300提交Ask1275386347981 6505741 126500 300取消Ask1275386348070 6511439 126100 17执行投标1275386348070 6511439 126100 17提交投标1275386348101 6511469 126600 300取消ASK表1:消息列表示例订单的主要优点是接受限额(即限额订单)和市场订单下的订单。在前一种情况下,交易员/经纪人愿意以特定价格出售或购买金融工具。在后一种情况下,会发生以当前价格购买或出售股票的行为。LOB接受提交限额订单的流动性提供商和提交市场订单的流动性制造商的订单。这些限额指令表示在市场指令到达或取消之前未执行的交易活动,构成了分为多个级别的LOB。最佳水平包括最高出价和最低要价订单,以及它们的平均价格,即所谓的中间价格,我们试图预测其变动。我们将中间价变动预测视为一个具有两个输出的多目标优化问题,一个与分类相关,另一个与回归相关。我们目标的第一部分是对中间价是上涨还是下跌进行分类,第二部分——回归部分是预测未来这一变动将发生多少事件。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 22:42