楼主: nandehutu2022
1063 34

[量化金融] 订单流量对价格影响的线性模型2。混合物 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.2521
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-5-11 06:07:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Linear models for the impact of order flow on prices II. The Mixture
  Transition Distribution model》
---
作者:
Damian Eduardo Taranto, Giacomo Bormetti, Jean-Philippe Bouchaud,
  Fabrizio Lillo, Bence Toth
---
最新提交年份:
2016
---
英文摘要:
  Modeling the impact of the order flow on asset prices is of primary importance to understand the behavior of financial markets. Part I of this paper reported the remarkable improvements in the description of the price dynamics which can be obtained when one incorporates the impact of past returns on the future order flow. However, impact models presented in Part I consider the order flow as an exogenous process, only characterized by its two-point correlations. This assumption seriously limits the forecasting ability of the model. Here we attempt to model directly the stream of discrete events with a so-called Mixture Transition Distribution (MTD) framework, introduced originally by Raftery (1985). We distinguish between price-changing and non price-changing events and combine them with the order sign in order to reduce the order flow dynamics to the dynamics of a four-state discrete random variable. The MTD represents a parsimonious approximation of a full high-order Markov chain. The new approach captures with adequate realism the conditional correlation functions between signed events for both small and large tick stocks and signature plots. From a methodological viewpoint, we discuss a novel and flexible way to calibrate a large class of MTD models with a very large number of parameters. In spite of this large number of parameters, an out-of-sample analysis confirms that the model does not overfit the data.
---
中文摘要:
对订单流对资产价格的影响进行建模对于理解金融市场的行为至关重要。本文第一部分报告了在描述价格动态方面的显著改进,当考虑过去收益对未来订单流的影响时,可以获得这些改进。然而,第一部分提出的影响模型将订单流视为一个外生过程,仅以两点相关性为特征。这种假设严重限制了模型的预测能力。在这里,我们试图用所谓的混合转移分布(MTD)框架直接模拟离散事件流,该框架最初由Raftery(1985)提出。我们区分了价格变化和非价格变化事件,并将它们与订单符号结合起来,以便将订单流动力学简化为四态离散随机变量的动力学。MTD表示完全高阶马尔可夫链的简约近似。新方法以足够的真实性捕捉了小股票和大股票的有符号事件与特征图之间的条件相关函数。从方法论的角度,我们讨论了一种新颖灵活的方法来校准一大类具有大量参数的MTD模型。尽管有如此多的参数,但抽样分析证实,该模型不会过度拟合数据。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--

---
PDF下载:
--> Linear_models_for_the_impact_of_order_flow_on_prices_II._The_Mixture_Transition_.pdf (1.46 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:线性模型 混合物 distribution parsimonious Improvements

沙发
mingdashike22 在职认证  发表于 2022-5-11 06:07:49
订单流量对价格影响的线性模型。混合过渡分布模型Damian Eduardo Taranto、Giacomo Bormetti、Jean-Philippe Bouchaud、Fabrizio Lillo和Bence T\'othScuola Normale Superiore、Piazza de Cavalieri 7、56126 Pisa、意大利博洛尼亚大学数学系、圣多纳托港广场540126 Bologna、意大利资本基金管理公司、巴黎大学路23-25号、法国巴黎大学路75007号、,2016年摘要对订单流量对资产价格的影响进行建模对于理解金融市场的行为至关重要。本文第一部分报告了在描述价格动态方面的显著改进,当考虑过去收益对未来订单流量的影响时,可以获得这种改进。然而,第一部分中提出的影响模型认为,订单流是一个外生过程,仅以两点相关性为特征。这种假设严重限制了模型的预测能力。在这里,我们试图用所谓的混合传递分布(MTD)框架直接对离散事件流建模,该框架最初由Raftery(1985)提出。我们区分了价格变化和非价格变化事件,并将它们与ordersign相结合,以便将订单流量动态减少为四状态离散变量的动态。MTD表示完全高阶马尔可夫链的简约近似。新方法以足够的真实性捕捉了小型和大型股票和签名图的签名事件之间的条件相关函数。从方法论的角度,我们讨论了一种新的、灵活的方法来校准一大类具有大量参数的MTD模型。

藤椅
能者818 在职认证  发表于 2022-5-11 06:07:52
尽管有如此多的参数,但样本外分析证实,模型不会过度拟合数据。1引言本文是[1]的补充。在之前的第一部分论文中,我们讨论了描述订单流量对价格影响的两个线性模型之间的差异和相似性,即瞬态影响模型(TIM)和历史相关影响模型(HDIM)。在这些模型中,订单流量的符号被认为是一个外生的、时间相关的过程,通过“传播者”,即过去值的线性组合(TIM)或通过“意外”机制(即已实现订单流量与其预期水平(HDIM)之间的偏差)影响价格动态。然而,在现实中,订单流不是外生的,它本身受过去价格历史的影响。在[1]中,我们根据[15,16]的精神,通过加强订单流的描述,来解释价格变动事件和非价格变动事件,部分克服了这个问题。这使得人们可以对订单流在发生变化后反转其符号的倾向进行编码,这一影响对于大型股票尤为重要。该扩展模型极大地改善了价格过程的描述,包括滞后依赖性(即特征图)和为负项计算的响应函数。然而,这种方法是不完整的,因为它没有规定订单流本身的数据生成过程,而订单流本身仅通过两点相关函数来描述。这不允许预测未来订单流量本身,例如交易是否可能改变价格。在本文中,我们试图对订单流和价格的联合动力学进行建模。

板凳
kedemingshi 在职认证  发表于 2022-5-11 06:07:55
这个模型家族在市场微观结构方面有着悠久的传统,始于哈斯布鲁克[2,3]的开创性工作,他提出了一个向量自回归(VAR)模型,用于订单流量和价格的联合动态。这种方法有两个主要的相关限制。结果表明,VAR模型适用于具有连续支持的变量(如高斯),而顺序流(符号和事件)和逐笔价格变化则更自然地由离散变量描述。其次,标准VAR方法规定了变量之间的线性关系,而更广泛的定义包括过去变量之间线性关系的可能性和未来观察给定变量值的可能性。一个范例是有限状态马尔可夫链Xt。设m为状态数,q为m×m时不变转移矩阵,设χt=(xt(1)。。。,xt(m))是一个行向量,如果xt=i,则xt(i)=1,否则为零。概率向量^χt=(P(Xt=1)。。。,P(Xt=m))由线性方程组^χt=χt确定-1Q。因此,在线性环境中描述离散值变量(如流动符号和价格变化)的联合动力学的自然方法是使用大阶马尔可夫过程。事实上,我们在参考文献[1]中已经表明,对于大型股票,具有两个传播因子(TIM2)的模型对应于价格变化和不变化的交易,在对真实数据进行校准时,给出了常数(时间)传播因子(见[1]图7左上角面板)。这意味着对订单流量的了解以及关于交易是否会改变价格的信息是价格动态的完全特征。

报纸
mingdashike22 在职认证  发表于 2022-5-11 06:07:59
因此,在线性模型的框架下,用m=4状态的马尔可夫过程来描述系统是很自然的(t、 πt)∈ {(-1,C)(-1,NC),(+1,NC),(+1,C)},对应于购买(t=+1)并销售(t=-1) 价格变动(πt=C)和不变动(πt=NC)交易。然而,马尔可夫模型的主要局限性来自订单流的长记忆[5,7]。由于订单流符号非常持久,低阶马尔可夫过程不适合描述真实市场。另一方面,高阶PDM的马尔可夫过程通常依赖于大量参数(O(mp)),当可用数据量有限时,可能会导致效率低下。因此,在本文中,我们建议使用一类简单但通用的高阶马尔可夫过程,称为混合转移分布(MTD)模型[20]及其推广(MTDg)[22]。由于结构简单,每个滞后都有助于以单独和相加的方式预测当前状态,因此模型参数空间的维数仅随MTDg模型的阶数线性增长,即O(mp)。模型可以通过最大似然法或广义矩法进行校准。此外,在m=2状态的情况下(如顺序流的符号),本文提出的MTDg模型简化为离散自回归(DAR)模型[19],该模型已用于对顺序流进行建模[14],并在本文的配套文件[1]。因此,MTD和MTDg旨在提供DAR(p)模型的自然推广,以解释任意数量的m≥ 2个状态,同时避免全马尔科夫模型参数数量的指数增长(mp)。也许令人惊讶的是,这类模型尚未应用于金融数据,本文试图填补这一空白。

地板
kedemingshi 在职认证  发表于 2022-5-11 06:08:02
事实上,我们工作的主要方法创新是将MTDg模型参数化,即使参数数量非常大,也可以对其进行估计,以解释财务数据的相关性结构。最近的连续时间建模使用了霍克斯过程[4],这与本文考虑的模型有一定程度的相似性。我们提醒大家,大型股票的特点是,股票大小和价格之间的比率相对较高,因此价差几乎总是等于一个股票。具体而言,我们在本文中认为,MTD和MTDg模型是一种很有前途的模型,用于研究大型股票的订单流和价格变化的联合动力学。与参考文献[1]中研究的模型相比,我们在此提供了订单流量的明确模型,尤其是其对过去价格动态的响应。因此,我们的目标是用MTD模型重现大型股票有符号事件的复杂条件相关函数(参见[1]图4的左面板,其曲线也在图1中重现)。此外,我们的建模方法允许对MTD对订单流量和未来价格变化的预测能力进行样本外分析。尽管如此,当在匿名订单流量上进行校准时,该框架仍有局限性,因为人们无法轻易区分来自“羊群效应”和来自“订单分割”的订单流量相关性。换句话说,尽管MTD明确预测了订单流对单个事件(脉冲响应)的响应,但在解释结果时必须谨慎,因为它可能无法描述市场对孤立的外源订单的真实反应(见[10,9,11])。论文的结构如下。在第2节中,我们回顾了MTD和MTDg的定义、主要性质和估算方法。

7
能者818 在职认证  发表于 2022-5-11 06:08:05
在第3节中,我们介绍了我们对模型的参数化,以及对估计的一些改进建议。本节还包含我们对真实财务数据的实证结果。第4节描述了一些用于预测价格变化和订单流量的样本外分析的结果,第5节我们得出了一些评论和结论,并讨论了我们方法的局限性。2混合物过渡分布模型2。1定义我们从一个简单但限制性的MTD模型定义开始。让{Xt}t∈Nbe随机变量序列,取有限集合X={1,…,m}中的值。如果对于所有t>p和所有(i,i,…,ip),该随机序列被称为p阶MTDg序列∈ Xp+1,P(Xt=i | Xt-1=我,Xt-p=ip)=pXg=1λgqgig,i,(1)其中向量λ=(λ,…,λp)受约束:λg≥ 0, G∈ {1,…,p},(2)pXg=1λg=1。(3) 矩阵nqg=hqgi,ji;i、 j∈ 十、1.≤ G≤ Po是正m×m随机矩阵,即≥ 0和mxj=1qgi,j=1G∈ {1,…,p},i、 j∈ 十、(4) Raftery[20]最初用相同的转移矩阵Qg定义了模型≡ Q foreach滞后g=1,这个模型叫做MTD。后来,Berchtold[22]引入了MTD模型的更一般定义,即从滞后变量子集{Xt]过渡的混合物-1.Xt-p} 到现在为止。换句话说,传递矩阵qgc的顺序可以大于1。Berchtold和Raftery[21]发表了一篇关于MTD模型的完整综述。他们重新证明了模型的极限行为及其自相关结构的理论结果。特别是,他们证明了如果等式的条件成立。满足2、3和4,然后是ofEq模型。1是一个定义良好的高阶马尔可夫链,其平稳分布^η=(^η,…,^ηm)存在且唯一。

8
能者818 在职认证  发表于 2022-5-11 06:08:09
上述混合转移分布模型是马尔可夫模型,其中每个模型都是滞后分布-1,Xt-2.对随机变量xt的分布有额外的贡献。因此,该模型在引言中描述的意义上是线性的。换句话说,这类模型的含义如下:为了确定发生在时间t的eventXt的类型,开始选择参考时间t- g在过去,其中g以概率λg绘制为一个区域。如果事件Xt-t发生在时间t-g为j型,然后选择t时的事件为i型,概率为qi,j。因此,该模型可以解释为马尔可夫过程的概率混合。对于这种解释,(λg)g=1,。。。,概率向量和Qgare随机矩阵是关键的。然而,正如原始文献[20,22]中已经指出的,当这些参数为负或大于1时,也可以定义MTDg模型,前提是条件0≤pXg=1λgqgig,i≤ 1.(i,i,…ip)∈ 满足Xp+1,(5),所有转移概率都得到了很好的定义。正如我们将在下面看到的,校准参数不一定符合概率解释。在本文中,我们将考虑一类特殊的MTDg模型,其中矩阵QG具有相同的稳态,即与特征值1对应的相同左特征向量^η。在这个假设下,推广[22]的结果,我们可以证明平稳分布的存在唯一性定理。定理2.1假设随机变量序列{Xt}t∈单位集X={1,…,m}中的包含值由p(Xt=i | Xt)定义-1=我,Xt-p=ip)=pXg=1λgqgig,i,其中Qg=hqgi,jii,j∈具有规范化行的Xare矩阵,Pjqgi,j=1,Ppg=1λg=1,并假设^ηQg=^η,g、 如果向量^η为^ηi>0,则i∈ X和πηi=1,和0<pXg=1λgqgig,i<1,(我,我。

9
nandehutu2022 在职认证  发表于 2022-5-11 06:08:13
,ip)∈ Xp+1,(6)thenlim`→∞P(Xt+`=i|Xt-1=我,Xt-p=ip)=^ηi.该定理的证明见附录A。注意,在该定理中,我们不需要假设参数(λg,Qg)为1≤G≤在0和1之间进行比较,但概率解释由条件(6)保证。最后请注意,^η上的条件意味着g我们可以写出Qg=Q+~Qg,其中^ηQ=^η和^ηQg=0.2.2估计尽管对于全马尔可夫模型来说很节省,MTDg参数θ=(λg,Qg)1≤G≤由于它们必须符合转移矩阵的规范化约束,因此很难进行估计。文献中提出了许多不同的估计方法[21],但在本文中,我们将重点讨论两种特定的方法:最大似然估计(MLE)和广义矩量法(GMM)。让我们详细介绍一下这些方法。2.2.1长度为n,{Xt=Xt}t=1,…,的给定数据序列的最大似然估计,。。。,n、 我们将(Xtt=Xtt)定义为事件序列(Xt=Xt,Xt+1=Xt+1,…,Xt=Xt),P(Xp=Xp)是{Xt=Xt}t=1,。。。,p、 根据p阶MTDg模型的定义,似然函数isL(θ)=pθ(Xn=Xn)=p(Xp=Xp)pθ(Xnp+1=Xnp+1 | Xp=Xp)=p(Xp=Xp)nYt=p+1pXg=1λgqgxt-g、 xt, (7) 为了估计MTDg模型的参数,我们从似然函数中排除了P(Xp=Xp)。因此,我们考虑的对数似然函数是`(θ)=logpθ(Xnp+1=Xnp+1 | Xp=Xp)=nXt=P+1logpXg=1λgqgxt-g、 xt, (8) 式中θ=(λg,Qg)1≤G≤psatis定义了等式的所有约束条件。2、3、4或6。因此,参数^θ的最大似然估计=^λg,^Qg1.≤G≤pis是以下约束非线性优化问题的解决方案:^λg,^Qg1.≤G≤p=argmax(λg,Qg)1≤G≤pnXt=p+1logpXg=1λgqgxt-g、 xt,s、 tpXg=1λg=1,λg≥ 0, G∈ {1,…,p}qgi,j≥ 0和mxj=1qgi,j=1G∈ {1, . .

10
能者818 在职认证  发表于 2022-5-11 06:08:17
,p},i、 j∈ 十、(9) 显然,由于约束的数量很多,以前的优化问题的解决非常困难。Berchtold[24]提出了一种有效的迭代过程,在MLE过程中进行边界调整,从而修改了牛顿方法。在等式2和3的约束下,Lebre和Bourguignon在[25]中引入了MTDg系数的隐藏过程,并提出了参数估计的期望最大化方法。Chen等人在[26]中指出,之前的所有约束都可以重写为boxconstrained形式,这更容易处理。2.2.2[20]中的广义动量法表明,MTD模型的二元分布满足与Yule-Walker方程类似的线性方程组。在这里,我们将这个结果推广到MTDg情况,即当转移矩阵Qgdi在每个滞后g处失效时。在附录B中,我们证明了以下命题:命题2.1假设一个随机变量序列{Xt}t∈有限集合X={1,…,m}中的包含值由公式1定义,并且是静止的。设B(k)是一个m×m矩阵,其元素为sbki,j=P(Xt=i,Xt+k=j),i,j∈ 十、K∈ Zand B(0)=diag(η,…,ηm)。然后b(k)=pXg=1λgB(k- g) Qg。(10) 系统(10)由mp微分方程组成,这些方程可用作应用于MTDg模型的GMM的正交条件。这些方程并不都是独立的,因为二元分布B(k)的矩阵满足通常的归一化条件。事实上,每个矩阵的行和列加起来就是相应的条件概率Pjbki,j=^ηiandPibki,j=^ηj。通过使用这些关系,独立方程的数量减少到p(m)- 2m+1)。方程组解的唯一性。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 07:58