楼主: 何人来此
1167 26

[量化金融] 金融市场价格形成的普遍特征:视角 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-6-14 00:44:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Universal features of price formation in financial markets: perspectives
  from Deep Learning》
---
作者:
Justin Sirignano and Rama Cont
---
最新提交年份:
2018
---
英文摘要:
  Using a large-scale Deep Learning approach applied to a high-frequency database containing billions of electronic market quotes and transactions for US equities, we uncover nonparametric evidence for the existence of a universal and stationary price formation mechanism relating the dynamics of supply and demand for a stock, as revealed through the order book, to subsequent variations in its market price. We assess the model by testing its out-of-sample predictions for the direction of price moves given the history of price and order flow, across a wide range of stocks and time periods. The universal price formation model is shown to exhibit a remarkably stable out-of-sample prediction accuracy across time, for a wide range of stocks from different sectors. Interestingly, these results also hold for stocks which are not part of the training sample, showing that the relations captured by the model are universal and not asset-specific.   The universal model --- trained on data from all stocks --- outperforms, in terms of out-of-sample prediction accuracy, asset-specific linear and nonlinear models trained on time series of any given stock, showing that the universal nature of price formation weighs in favour of pooling together financial data from various stocks, rather than designing asset- or sector-specific models as commonly done. Standard data normalizations based on volatility, price level or average spread, or partitioning the training data into sectors or categories such as large/small tick stocks, do not improve training results. On the other hand, inclusion of price and order flow history over many past observations is shown to improve forecasting performance, showing evidence of path-dependence in price dynamics.
---
中文摘要:
通过将大规模深度学习方法应用于包含数十亿美国股票电子市场报价和交易的高频数据库,我们发现了非参数证据,证明存在一种与股票供求动态相关的普遍且稳定的价格形成机制,如订单所示,其市场价格的后续变化。我们通过测试其对价格变动方向的样本外预测来评估该模型,考虑到价格和订单流的历史,跨越广泛的股票和时间段。通用价格形成模型显示,对于不同部门的各种股票,跨时间的样本外预测精度非常稳定。有趣的是,这些结果也适用于不属于训练样本的股票,表明该模型捕获的关系是普遍的,而不是特定于资产的。基于所有股票数据训练的通用模型在样本外预测精度方面优于基于任何给定股票时间序列训练的特定资产线性和非线性模型,表明价格形成的普遍性有利于汇集各种股票的财务数据,而不是像通常那样设计特定于资产或部门的模型。基于波动性、价格水平或平均价差的标准数据规范化,或将培训数据划分为部门或类别,如大型/小型股票,不会改善培训结果。另一方面,在过去的许多观察中纳入价格和订单流历史可以提高预测性能,显示价格动态中存在路径依赖的证据。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Universal_features_of_price_formation_in_financial_markets:_perspectives_from_De.pdf (1.23 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:价格形成 市场价格 金融市场 市场价 Quantitative

沙发
可人4 在职认证  发表于 2022-6-14 00:44:46
金融市场价格形成的普遍特征:来自深度学习的视角JustinSirignano*和Rama Cont+2018年3月20日摘要通过将大规模深度学习方法应用于包含数十亿美国股票电子市场报价和交易的高频数据库,我们发现了非参数证据,证明存在与股票供求动态相关的通用和固定价格形成机制,如订单所示,其市场价格的后续变化。我们通过测试其对价格变动方向的样本外预测来评估该模型,给出了价格和订单流的历史,涵盖了广泛的股票和时间段。通用价格形成模型在不同行业的广泛股票中显示出随时间变化的显著稳定的样本外预测准确性。有趣的是,这些结果也适用于不属于训练样本的股票,表明该模型捕捉到的关系是通用的,而不是资产特定的。通用模型(根据所有股票的数据训练)在样本外预测精度方面优于任何给定股票时间序列上训练的资产特定线性和非线性模型,表明价格形成的普遍性有利于汇集各种股票的财务数据,而不是像通常那样设计特定于资产或部门的模型。基于波动性、价格水平或平均价差的标准数据规范化,或将培训数据划分为部门或类别,如大型/小型股票,不会改善培训结果。

藤椅
何人来此 在职认证  发表于 2022-6-14 00:44:50
另一方面,在过去的许多观察中纳入价格和订单流量历史可以提高预测性能,显示价格动态中的路径依赖性证据。*伊利诺伊大学香槟分校+CNRS&伦敦帝国理工学院数学系。通讯作者作者感谢2018年伦敦定量峰会的研讨会参与者、摩根大通和普林斯顿大学的评论。这篇论文的计算是使用CFMImperial定量金融研究所(CFMImperial Institute of Quantitative Finance)和Blue Waters超级计算机(Blue Waters Super Computer)的“神经网络分布式学习”(Distributed Learning with Neural Networks)资助进行的。内容1价格形成:市场价格如何对供需作出反应22通过深度学习建立的数据驱动的价格形成模型43结果73.1深度学习与线性模型。93.2资产的普遍性。113.3平稳性。153.4路径依赖性。154讨论161价格形成:市场价格如何对供需作出反应金融市场的计算机化以及过去十年金融市场订单流量和价格动态详细电子记录的可用性释放了上市市场交易、订单流量和订单簿动态的高频数据,这为我们提供了这些市场中供应、需求和价格的高频动态的详细视图【9】。这些数据可用于探索价格形成机制的性质,该机制描述了市场价格如何对供求波动作出反应。

板凳
nandehutu2022 在职认证  发表于 2022-6-14 00:44:53
从较高的层面来看,“价格形成机制”是一张表示市场价格与价格历史和订单流量:价格(t+t) =F价格历史记录(0…t)、订单流(0…t)、其他信息= F(Xt,t) ,其中XT是一组状态变量(例如价格、波动率和订单流量的滞后值),具有一定的动态性和这是一个随机的“噪音”或创新术语,表示新信息的到来以及状态变量无法完全捕捉到的其他影响。经验和理论市场微观结构模型、随机模型和机器学习价格预测模型都可以被视为以不同的时间分辨率表示该mapF的不同方式t、 文献中隐含的一个问题是mapF的普遍性程度(即独立于所考虑的特定资产)。市场微观结构模型的一般表述似乎隐含着这样一种普遍性,它与特定资产相反。关于某些程式化事实普遍性的经验证据【10】和标度关系【3、1、28、23】似乎支持普遍性假设。然而,金融时间序列的统计建模实践仍然是特定于资产的:在为给定资产的回报建立模型时,市场从业者和计量经济学家仅使用来自同一资产的数据。

报纸
nandehutu2022 在职认证  发表于 2022-6-14 00:44:56
例如,微软的模型只能使用微软的数据进行估计,而不会使用其他股票的数据。此外,用于估算的数据通常仅限于最近的时间窗口,反映了这样一种信念,即财务数据可能是“非平稳”的,并且容易发生制度变化,这可能会使较旧的数据与预测不太相关。由于这些考虑,金融计量经济学、交易和风险管理应用中考虑的模型是特定于资产的,其参数是使用最新数据的时间窗口随时间(重新)估计的。也就是说,对于时间t处的资产i,模型假定价格为(t+t) =FXi0:t,t |θi(t),其中,模型参数θi(t)使用与资产i相关的价格和其他状态变量的最新数据定期更新。因此,数据集在资产和时间上分散,甚至在高频领域,用于模型估计和培训的数据集的大小比成功应用大数据分析的其他领域中遇到的数据集的大小小几个数量级。这就是为什么除少数情况外,没有为定量金融建模部署大规模学习方法(如深度学习)的原因之一【8、15、26、29、30】。特别是,有时会调用non-stationarityragument来警告不要使用它们。另一方面,如果这些变量之间的关系是普遍的和平稳的,即如果参数θi(t)既不随资产i变化,也不随时间t变化,则可以跨不同的资产和时间段汇集数据,并使用更丰富的数据集来估计/训练模型。

地板
nandehutu2022 在职认证  发表于 2022-6-14 00:45:00
例如,关于一个资产市场的崩盘事件的数据可以提供关于另一个资产的价格将如何应对严重不平衡的流动的见解,无论这种事件在其历史上是否发生过。在这项工作中,我们使用基于DEP学习的非参数方法,为订单流量和市场价格波动之间存在这种普遍、平稳的关系提供了证据。深度学习可以使用“深层”多层神经网络来估计变量之间的非线性关系,这些神经网络使用“监督学习”方法在大型数据集上训练。使用在高频数据库上训练的深层神经网络架构,该数据库包含数十亿份美国股票的电子市场交易和报价,我们发现了存在一种通用和稳定的价格形成机制的非参数证据,该机制与股票供求动态相关,如订单所示,其市场价格的后续变化。我们通过测试其对价格变动方向的样本外预测来评估该模型,考虑到价格和订单流的历史,以及广泛的股票和时间段。通用价格形成模型在不同行业的广泛股票中,在不同时间段表现出显著稳定的样本外预测精度。有趣的是,这些结果也适用于不属于训练样本的股票,表明该模型捕捉到的关系是普遍的,并且不是特定的。我们观察到,因此训练的神经网络优于线性模型,表明订单流量和价格变化之间存在非线性关系。本文为金融市场中普遍存在的价格形成机制提供了定量证据。

7
大多数88 在职认证  发表于 2022-6-14 00:45:03
价格形成机制的普遍性反映在这样一个事实上,即根据所有股票的数据训练的模型在样本外预测精度方面优于根据任何给定股票的时间序列训练的股票特定线性和非线性模型。这表明,价格形成的普遍性有利于汇集各种股票的财务数据,而不是像通常那样设计股票或特定行业的模型。此外,我们还观察到,标准的数据转换,如基于波动率或平均价差的标准化,或将训练数据划分为部门或类别,如大型/小型股票,并不能改善训练结果。另一方面,将价格和订单流量历史纳入许多过去的观测值,可以提高预测性能,显示价格动态中的路径依赖性证据。值得注意的是,通用模型能够推断或推广到不在训练集中的股票。通用模型能够在全新股票上表现良好,这些股票的历史数据是该模型从未训练过的。这意味着universalmodel捕捉到了价格形成机制的特征,这些特征在股票和行业中都很强大。对于缺失数据问题和新发行证券常常使模型估计复杂化的金融领域的应用来说,这一特性本身就非常有趣。大纲第2节描述了用于提取价格形成机制信息的数据集和监督学习方法。第3节为订单流量和价格历史与价格变化之间存在普遍且稳定的关系提供了证据。

8
能者818 在职认证  发表于 2022-6-14 00:45:06
第4节总结了我们的主要发现,并讨论了一些含义。2通过深度学习的价格形成数据驱动模型应用程序,如图像、文本和语音识别,由于“深度学习”的发展而发生了革命性的变化,即使用在大数据集上训练的多层(“深度”)神经网络来揭示高维输入(“特征”)和输出之间的复杂非线性关系[19]。在抽象层次上,深层神经网络通过迭代(“层”)表示高维输入向量x和输出y之间的函数关系y=f(x),迭代(“层”)由加权和组成,然后应用非线性“激活”函数。每个迭代对应一个“隐藏层”,而深层神经网络可以有许多隐藏层。通过适当选择每层中的权重,神经网络可以用作复杂非线性关系的“通用近似器”[21]。在监督学习方法中,通过优化正则化成本函数来估计网络权重,该函数反映了网络输出和期望输出之间的样本差异。在深层神经网络中,这代表了对数十万(甚至数百万)个参数的高维优化。由于参数数量大、数据量大,这种优化具有计算紧张性。随机梯度下降算法(如RMSprop或ADAM)用于训练神经网络,训练在图形处理单元(GPU)上并行。我们应用这种方法来了解电子货币交易所(ElectroniceExchange)的供求关系(记录在每种股票的订单历史中)以及随后的市场价格变化。

9
大多数88 在职认证  发表于 2022-6-14 00:45:09
我们的数据集是2014年1月1日至2017年3月31日期间纳斯达克交易的约1000只股票的所有订单、交易和订单取消的高频记录。图1:limit order book表示电子交易所上库存供需的快照。“ask”端代表卖出订单,“bid”端代表买入订单。规模表示在给定价格下可供出售/购买的股份数量。最低售价(ask)和最高买价(bid)之间的差值是“价差”(在本例中为1美分)。通过交易所的订单簿不断提交、取消和执行电子买卖订单。“限价指令”是指以特定价格买入或卖出股票的指令,并将以该价格出现在订单簿中,直到取消或执行为止。“限额订单簿”是所有未完成限额订单的快照,因此代表了可见的库存供需情况(见图1)。在美国股市,订单可以以1美分的倍数进行交易。“最佳要价”是最低的sellorder,“最佳出价”是最高的出价。最佳要价和最佳出价是股票可以立即买卖的价格。“中间价”是最佳要价和最佳出价的平均值。随着新订单的提交、现有订单的取消和交易的执行,订单簿会随着时间的推移而变化。在纳斯达克(NASDAQ)等电子市场,新订单可能会以很高的频率(有时每微秒一次)到达,某些股票的订单簿每天可以更新数百万次。

10
何人来此 在职认证  发表于 2022-6-14 00:45:12
这将产生TB的数据,我们将其用于构建价格形成过程的数据驱动模型。当输入数据是时间序列时,因果关系约束要求输入和输出之间的关系遵守时间顺序。只有过去可以影响现在。反映这一约束的网络架构是基于长-短期记忆(LSTM)单元的循环网络(见图2中的一个示例)[17]。每个LSTM单元都有一个内部状态,该状态保持所有过去数据的非线性表示。新数据到达时,会更新此内部状态。我们的网络有3层历史订单数据是使用LOBSTER数据引擎从纳斯达克III级数据重建而来的【25】。ht公司-1小时-mt公司-1hnt-1年期-1Xt-1ht-1(1)hn-mt公司-1(1)hnt-1(1)ht-1(2)hn-mt公司-1(2)hnt-1(2)hthn-mthntYtXtht(1)hn-mt(1)hnt(1)ht(2)hn-mt(2)hnt(2)ht+1hn-mt+1hnt+1Yt+1Xt+1。图2:递归神经网络的结构。LSTM单元,然后是直线单元(RELU)的最终前馈层。下一次价格变动的可能性分布是通过应用softmax activationfunction生成的。LSTM单元专门设计用于对数据的时间序列进行高效编码【17,19】。我们训练网络从状态变量向量预测下一次价格变动,该向量对订单历史在许多观察滞后上进行编码。指数t表示价格变化的次数。在高层,LSTM网络的形式为(Yt,ht)=f(Xt,ht-1.θ). (2.1)Ytis是对下一次价格变动的预测,Xt是时间t时订单的状态,Ht是深度学习模型的内部状态,代表从X到t的历史中提取的信息,θ表示模型参数,对应于神经网络中的权重。在每个时间点t,模型使用状态变量Xt的当前值(即。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 11:54