楼主: 可人4
1083 11

[量化金融] 基于机器学习技术的中间价预测 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
49.0443
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-6-24 10:26:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Mid-price Prediction Based on Machine Learning Methods with Technical
  and Quantitative Indicators》
---
作者:
Adamantios Ntakaris, Juho Kanniainen, Moncef Gabbouj, Alexandros
  Iosifidis
---
最新提交年份:
2019
---
英文摘要:
  Stock price prediction is a challenging task, but machine learning methods have recently been used successfully for this purpose. In this paper, we extract over 270 hand-crafted features (factors) inspired by technical and quantitative analysis and tested their validity on short-term mid-price movement prediction. We focus on a wrapper feature selection method using entropy, least-mean squares, and linear discriminant analysis. We also build a new quantitative feature based on adaptive logistic regression for online learning, which is constantly selected first among the majority of the proposed feature selection methods. This study examines the best combination of features using high frequency limit order book data from Nasdaq Nordic. Our results suggest that sorting methods and classifiers can be used in such a way that one can reach the best performance with a combination of only very few advanced hand-crafted features.
---
中文摘要:
股票价格预测是一项具有挑战性的任务,但机器学习方法最近已成功用于此目的。在本文中,我们从技术和定量分析中提取了270多个手工特征(因素),并在短期中期价格变动预测中检验了它们的有效性。我们重点讨论了一种使用熵、最小均方和线性判别分析的包装特征选择方法。我们还为在线学习构建了一个新的基于自适应logistic回归的定量特征,该特征在大多数提出的特征选择方法中始终处于第一位。本研究使用纳斯达克北欧证券交易所的高频限价指令簿数据来检验特征的最佳组合。我们的结果表明,排序方法和分类器的使用方式可以使您只需结合极少数高级手工功能即可达到最佳性能。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Mid-price_Prediction_Based_on_Machine_Learning_Methods_with_Technical_and_Quanti.pdf (1.47 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 中间价 Quantitative Applications discriminant

沙发
kedemingshi 在职认证  发表于 2022-6-24 10:26:08
基于具有技术和定量指标的机器学习方法的中期价格预测Damantios Ntakarisa,*, Juho Kanniainna、Moncef Gabbouja、Alexandros Iosi fidisbafaculty of Information Technology and Communication Sciences,Tampere University,FI-33720,Tampere,Finlandb工程、电气和计算机工程系,奥胡斯大学,8000,Aarhus,DenmarkAbstracts股票价格预测是一项具有挑战性的任务,但是机器学习方法最近已经成功地用于这一目的。在本文中,我们从技术和定量分析中提取了270多个手工特征(因素),并在短期中期价格走势预测中检验了它们的有效性。我们重点讨论了一种使用熵、最小均方和线性描述分析的包装特征选择方法。我们还为在线学习构建了一个新的基于自适应logistic回归的定量特征,该特征在大多数提出的特征选择方法中一直处于首选。这项研究使用纳斯达克北欧证券交易所(Nasdaq Nordic)的高频限价订单账簿数据来检验特征的最佳组合。我们的结果表明,排序方法和分类器可以在这样的地方使用,只需结合极少数高级手工特征即可达到最佳性能。关键词:高频交易、中间价、机器学习、技术分析、定量分析1。引言本文考虑的问题是在高频金融交易期间预测股票的中间价格变动。在给定的时间实例中,股票的中间价定义为最佳买卖价格的平均值。我们认为中间价对于持续平衡库存的做市商以及需要能够预测市场走势以盈利的交易员来说是至关重要的信息。

藤椅
可人4 在职认证  发表于 2022-6-24 10:26:11
此外,中间价有助于监控市场的稳定性(即欺骗识别)。在过去几年中,已经提出了几种分析股市数据的方法,如[18]、[33]、[68]、[81]、[87]、[89]和[90]中所述的方法。所有这些方法都遵循由两个处理步骤组成的标准分类管道。给定交易过程中的一个时间实例,根据当前实例之前的一个(通常很短)时间窗口来描述市场状态。选择一组手工制作的功能来描述市场动态,从而形成avector表示。基于这种表示,然后使用分类器预测预测范围内某个时间点的市场状态,如图1所示。我们在第2节中看到的大多数研究使用了非常有限的功能,但没有提供选择这些功能的动机,而在这里我们涵盖了大多数:i)技术指标,ii)最先进的限额订单(LOB)功能,以及iii)定量指标。也利用这些特征集的工作可以在[65]中找到。此外,我们还提出了一种新的advancequantitative特征,该特征是在几种特征选择机制中首先选择的,用于中等价格变动预测任务。使用不同的手工制作功能会导致对金融时间序列的不同属性进行编码,排除其中一些功能可能会导致无法利用*相应的authorEmail地址:adamantios。ntakaris@tuni.fi(Adamantios Ntakaris)图1:中间价格预测的概念可以描述如下:在给定的时间实例t,股票的状态被编码为基于向量的表示,该表示使用来自长度为t的短期时间窗口的多维时间序列信息计算得出。

板凳
何人来此 在职认证  发表于 2022-6-24 10:26:14
鉴于此表示,预计中间价的方向为t、 相关信息。一组好的特征的定义与后续分析的性能直接相关,因为在这一阶段丢弃的任何信息稍后都无法由分类器恢复。用于解决此问题的最广泛采用的方法之一是使用特征选择方法(例如,[15]、[57]),该方法可以使用各种类型的特征排序标准以包装方式执行。虽然使用基于变换的降维技术(如主成分分析或线性判别分析)可以产生类似的处理管道,但在本文中,我们感兴趣的是确定传递数据中大部分信息的特征集。[5]和[52]中使用了使用无监督标准的特征选择,尤其是最大熵标准。这种方法背后的动机是,随着特征的熵增加(当在一组数据中计算时),数据方差以及它编码的信息也会增加。然而,在基于avector的表示中,许多高熵特征的组合并不一定会带来良好的分类性能。这是因为所采用的数据表示的不同维度需要编码不同的信息。在本文中,我们对各种手工制作的特征(总共273个)进行了广泛的分析,形成了价格变动预测。我们的分析基于一种基于包装的特征选择方法(即[48]),该方法利用无监督和有监督的特征排序标准。更具体地说,我们使用最大熵(即[5]、[52])、基于线性判别分析(LDA)[84]的最大类判别以及基于回归的分类[16]。

报纸
大多数88 在职认证  发表于 2022-6-24 10:26:18
功能选择方法的这些不同实现被应用于大量手工制作的功能。我们研究中使用的手工特征列表涵盖了两种不同交易方法的基本和高级特征,即侧重于技术和定量分析的交易方法。技术分析基于这样一个事实,即价格预测可以通过监控价格和成交量图来实现,而定量分析则侧重于统计模型和参数估计。对于技术指标,我们通过数字滤波器计算基本和高级功能,而对于定量指标,我们主要关注时间序列分析和在线机器学习。我们提供完整的特征列表和描述,并将其作为十二个特征选择模型(每个模型对应不同的标准和分类组合)的输入,用于我们的分类任务。我们不仅给出了这两类特征的最佳子集组合,而且还就F1性能对特征库的两种交易方式进行了清晰的比较(即F1得分是衡量性能的最重要指标,并计算为精确度和召回率的调和平均值)。据我们所知,这是第一次研究确定哪些类型的信息需要用于高频时间序列描述和分类。我们工作的主要贡献在于三大支柱。第一支柱是指在高频tradinguniverse中首次利用文献中的大部分技术指标。第二个支柱是开发新的量化特征,称为自适应logisticregression特征,该特征在多个特征选择指标中排名第一。

地板
kedemingshi 在职认证  发表于 2022-6-24 10:26:21
最后,第三个支柱是通过将熵、LDA和LMS转换为特征选择标准,对这三个特征集(即技术、定量和LOBindicators)进行公平和程度的评估。该评估利用LMS、LDA和径向基函数网络(RBFN)作为中等价格移动预测任务的分类器。我们的发现表明,只有利用从定量和技术手工制作的功能集中获得的极少数高级功能,才能达到最佳性能。论文的其余部分组织如下。我们在第2节中提供了全面的文献综述。第3节提供了问题陈述和数据描述。第4节列出了手工制作的功能。在第5节中,我们描述了我们分析中采用的包装器方法的各种实现,而第6节提供了实证结果,第7节总结了本文。附录部分提供了我们实验中使用的所有特性的详细描述,以及每个方法的所有排名列表。2、相关知识算法交易(algorithmic trading)的兴起表明信号和统计分析。算法交易是一种需要根据特定规则使用计算机的交易,可以快速执行精确计算。有几种工具基于这两种类型的分析,机器学习(ML)交易者可以利用这两种分析来选择最佳交易。但是,哪些指标(即。

7
何人来此 在职认证  发表于 2022-6-24 10:26:24
ML traderto应考虑功能),以确保专业移动?历史价格和当前价格是否包含所有相关信息?由于使用了技术和定量分析,找到这些问题的答案很有挑战性。前一类表明存在可以从历史数据中提取的隐藏信息和模式,而后一类表明统计模型和概率可以为ML交易者提供相关信息。与定量分析相比,技术分析(即[61])传统上受到的学术审查较少。然而,一些研究将技术指标作为信号分析和价格预测的主要机制。在HFT领域,作者在[78]中使用了七个交易规则族来衡量交易速度的影响,而在[44]中,提出了基于高速交易技术指标的模糊动量分析。语法演变在E-mini标准普尔500指数期货市场中使用,以及[32]中用于进入和退出交易探索的技术指标。在[53]中,作者通过自动策略对纳斯达克股票的非参数核回归的图表分析进行了广泛的调查。一种基于人工神经网络(arti-ficial neuralnetworks,ANN)的决策支持系统,其中六项基本技术指标被用作信号生成的输入特征,如【18】所述。【43】中针对FOREXmarket使用了自适应神经模糊推理系统(ANFIS),其中使用了技术指标来衡量ANFIS的性能。技术指标是【10】、【50】、【86】和【74】中被动交易策略(即买入并持有)和止损/止损策略工作的基础。【69】中使用了十个技术指标列表作为几个ML算法的输入特征(即。

8
mingdashike22 在职认证  发表于 2022-6-24 10:26:27
ANN、SVM、随机森林和朴素贝叶斯)预测股票趋势。感兴趣的读者还可以通过【19】、【20】、【47】、【66】、【92】和【97】中的技术指标找到ML方法的实施。技术指标也被[2]用于美国市场的股票溢价预测,在样本期外(1966-2014年),技术指标被证明是有效的。对于德国债券市场,【4】中的作者扩展了技术分析师案例的判断引导域。作者证明,通过仅使用技术指标的子集,技术分析师可以与专家的统计模型一样可靠。然而,也有定量分析,涉及ML交易员在做出交易决策时使用复杂的数学和统计数据作为指标。定量金融是一个广泛的领域,涉及投资组合优化(例如,[3]、[12]、[38]、[55]、[56]、[70])和资产定价(例如,[29]、[31]、[42]、[51]、[58]、[75]、[79])、风险管理(例如,[21]、[23]、[36]、[82])以及时间序列分析(例如,[7]、[9]、[39]、[85])。在这项工作中,我们专注于时间序列分析,并使用财务定量时间序列分析中调整为ML的思想。例如,【80】中的作者通过相关分析使用SVM和决策树进行股市预测。定量分析的另一个方面是建立交易策略,如均值回归(即[71])。这种交易策略的一个简单例子是,ML交易者计算布林带以现货交易信号并测试假设。此外,如【54】所述,金融时间序列用于由布林带生成的进入和退出信号探测。还应测试时间序列分析的协整性,如【26】所示。

9
何人来此 在职认证  发表于 2022-6-24 10:26:31
定量分析的另一个方面是计算订单不平衡策略的订单账面不平衡。在[81]中,这一思想被用作深层神经网络的一个特征。在目前的工作中,我们侧重于基于技术和定量分析的手工特征提取。我们表明,从这些组中提取的特征组合能够提高预测能力。[30]采用了一种基于技术指标和时间序列模型的资产收益预测组合方法。据我们所知,这是首次尝试在HFTliterature中以包装方式使用几种特征选择方法对这些贸易学校进行比较。问题陈述HF型交易需要不断分析市场动态。制定这些动态的一种方法是构建限额订单簿(LOB),如表2所示。LOB是累积订单流量,表示未执行或取消的有效限额订单,列在所谓的消息列表中,如表1所示。LOB是由随机过程描述的多维信号,其动力学被描述为c\'adl\'ag函数(即[33])。针对特定的限价订单(即在特定时间t具有特定价格和数量特征的订单)制定函数,如:订单=(t,价格,体积),在时间t变为活动状态,则表示:订单∈ L(t),顺序/∈ limorder公司↑orderxL(订单)。时间戳Id价格数量事件侧1275377039033 1372349 341100 300提交标书1275377039033 1372349 341100 300取消标书1275377039037 1370659 343700 100提交Ask1275377039037 1370659 343700 100取消Ask1275377039037 1372352 341700 150提交标书1275377039037 1372352 341700 150取消标书表1:消息列表示例。

10
能者818 在职认证  发表于 2022-6-24 10:26:34
2010年6月1日来自瓦锡兰Oyj的样本。根据LOB的构造方式,我们根据事件到达来处理新信息。我们的工作目标是预测中间价(即(pa+pb)/2)的方向(即上升、下降和稳定状态),其中PAI是要价,PBI是LOB第一级的投标价)。目标是利用基于订单流量(即消息列表或消息簿[MB])和LOB的信息功能,这将帮助ML交易员提高中期价格变动预测的准确性。4、特征池LOB和MB是我们用于特征提取的源。我们在表3中提供了技术和定量交易文献中探讨过的完整特性列表。级别1。。。询问投标时间戳价格数量价格数量1127537703903 343600 100 342300 485。。。1275377039033 343600 100 342300 485 ...1275377039037 343600 200 342300 485 ...1275377039037 343600 200 342300 485 ...1275377039037 343600 200 342300 485 ...1275377039037 343600 200 342300 485 ...1275377039037 343600 200 342300 485 ...1275377039037 343600 200 342300 485 ...表2:订单簿示例。2010年6月1日来自瓦锡兰Oyj的样本。选择建议的特征列表的动机是基于对所有基本和高级特征的检查,这些特征来自技术分析,并与高级统计模型进行比较,如在线学习的自适应逻辑回归。目前的研究发现,现有文献在技术指标的表现以及与定量模型的比较方面存在差距。目前的工作为今后在这方面的每一项工作奠定了基础,因为它深入了解了在可预测性方面可能在排序列表中获得较高排名的功能。为此,我们将功能集分为三个主要组。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 12:55