楼主: 能者818
2268 45

[量化金融] 订单流的队列反应Hawkes模型 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-11 11:46:21
相应地,NLt、NCt、NMt、λL(t)、λC(t)和λM(t)将表示计数过程及其相关强度,这些强度由各自的限制、取消和市场订单到达最佳出价(或最佳询问)确定。我们将QRH模型的这种变体称为QRH Imodel,因为它主要涉及单个LOB队列(在最佳出价或最佳询问条件下)。对于“”,m∈ {L,M,C}(分别针对限价、市价和取消订单),QRH-I模型将λ`(t)定义为:λ`(t)=u`(q(t-)) +XmZtφ\'m(t- s) dNms。(4) 其中,队列大小q(t)仅为q(t)=q(0)+NLt- NMt公司- NCt。由于市场订单和取消订单只能在队列非空时发送,在q(t)=0的情况下,对于`=M,C,前面的表达式应替换为λ`(t)=0。基线强度{u`(q)}取决于LOB状态q,而霍克斯核φ` M(t)说明了过去出现的M类订单对当前强度λ`(t)的影响。严格来说,为了完成模型定义,应该指定初始队列大小q(0)的规律。由于如下所示,我们将考虑一种情况,当队列过程是遍历向量马尔可夫过程的一个组成部分时,选择该定律并不相关,我们只需选择q(0)=0。让我们注意到,QR模型(具有独立队列)的强度函数和astandard Hawkes模型的强度函数都可以视为QRH-I模型强度函数的特例。当Hawkes核为零时,恢复QR模型,并恢复恒定基线强度的标准多变量Hawkesmodel。我们按照[16]进行,假设模型(4)在参考价格不变的时期内保持不变,而且这些时期可以被视为独立的变现。请注意,每次参考价格发生变化时,我们都会重置霍克斯内存。

12
大多数88 在职认证  发表于 2022-6-11 11:46:24
在分析实证结果时,我们将在下面讨论这一点,我们将在第3节提出的模型中放弃这一假设。可以使用最大似然法估计模型参数。组件不共享任何参数的D维点过程的对数似然LO具有以下一般形式(见第21页的[10])L(θ)=DX`=1L`(θ),其中L`(θ)=ZTlogλ`(t;θ| Ft)dN`t-ZTλ`(t;θ| Ft)dt(5),其中θ表示参数集,λ`是第`-个分量的强度函数。为了在实践中使用该方法,必须为交互核φ\'min公式(4)指定参数形式。一个标准的选择是考虑φ\'mca可以写成指数核的和:φ\'m(t)=UXu=1α\'muβue-βu(t-s) (6)其中α\'mu是模型的参数,βu,u是适当选择的超参数。该选项还显示了一个重要的优点,即得到的对数似然是模型参数的凸函数。为了便于表示,我们使用~u和~α来表示所有u′和α′μ。通过这种参数化,θ=(~u,~α)。因此,QRH-I模型(4)的对数似然为:L(θ)=DX`=1N` Xk=1logu`(q(tk))+DXm=1UXu=1α\'muβuZte-βu(t-s) dNms公司-DX`=1ZTu`(q(s))+DXm=1UXu=1α\'muβuZse-βu(s-v) dNmvds(7)如附录A.2所示,指数函数之和的特定选择(公式(6))允许计算有效的对数似然及其梯度。参数化的另一个重要优点(6)是它允许我们在马尔可夫过程的框架内工作。让我们注意I={C,M}减少队列大小的订单类型集,j={L}增加队列大小的订单类型集。因此,队列大小q(t)只对应于:q(t)=Xm∈JNmt公司-X个`∈IN\'t.(8)如果一个defineso\'mu(t)=Ztα\'mue-βu(t-s) dNms,(9),并用o(t)表示通过o\'mu(t)(u)的垂直叠加获得的向量∈ {1, . .

13
mingdashike22 在职认证  发表于 2022-6-11 11:46:27
. , U} ,`,m∈ {L,M,C}),然后q(t)-→o(t)是向量马尔可夫过程。这一性质可以沿着与[17]中第2.2条建议相同的路线证明。此外,如果假设x`∈Iu`(q)≥ c`q和um(q)≤ c*, m级∈ J,我们在附录A.1中,借助李雅普诺夫函数方法,证明了该过程q(t)-→o(t)是V-一致遍历的,这意味着q(t)允许不变分布,并且该平衡以指数速度达到。2.2校准结果数据在本研究中,我们使用德国联邦期货和欧洲期货交易所电子期货市场DAX指数期货交易的逐笔L1级数据。数据范围为2013年10月1日至2014年9月30日。该数据集包含订单一级的快照,每个快照都有一个时间戳,以微秒精度指示记录时间,提供价格和未付数量。每次交易发生时,数据集中都会添加一条特定的行,从而可以精确确定导致LOB变化的订单类型(即限价订单、取消订单或市场订单)。欧洲期货交易所期货市场的开放时间为法兰克福时间上午8点至晚上10点,无论本文如何详尽,我们只考虑上午9点至晚上9点的时间段,以捕捉最活跃的时期。在表1中,我们报告了我们数据集的一些描述性统计数据。我们注意到,从微观结构的角度来看,外滩期货可被视为一种大型tick资产,平均利差为1,而DAX的感知tick大小比外滩小得多。市场微观结构层面的这种差异也将反映在队列动态和我们模型的结果中。

14
大多数88 在职认证  发表于 2022-6-11 11:46:30
事实上,外滩上的排队队伍往往很大,因为中间价在相对较长的一段时间内保持不变,而出价/出价在最好的报价处累积,而另一方面,在最大的情况下,中间价变化更频繁,从而导致在最好的报价处排队更细。关于数据集的进一步详细信息以及事件间时间分布的更详细描述可参见【23】。让我们强调一下,由于在我们的设置中,订单簿被视为独立队列的集合,因此,我们先验地采用了严格的买卖对称性,所有结果都以秒表示。2对应于在买卖双方获得的平均估价。在本文中,我们略带滥用语言,使用“市场秩序”一词来表示任何直接促成交易的秩序,无论其是否有限价L#C#M平均分布中等。传播AES Med。事件间时间间隔5.41×104.67×106.29×101.012 1.0 6.34 4.89×10-4DAX 5.46×105.62×106.68×101.591 2.0 1.30 1.73×10-表1:数据集的描述性统计。每日最高报价的平均限价、取消和市场订单数量。平均价差和中值价差(以刻度为单位)以及合同中表示的平均订单规模。估计和拟合优度分析为了估计我们模型的参数,在我们样本中的每一天,我们首先计算本节开头规定的参考价格。然后,我们确定队列大小,如【16】所示,我们假设所有事件的订单大小与平均事件大小(AES)相对应,定义为达到Q±1的所有类型订单的平均数量。因此,我们以AES asq(t)为单位测量队列q=v(t)AES(10) 在哪里是上限函数,v(t)是队列中时间t的可用体积。

15
能者818 在职认证  发表于 2022-6-11 11:46:33
图1展示了外滩(左面板)和DAX(右面板)的定义q(t)的经验分布。这些分布是通过在整个时间段内每隔30秒对书本状态进行采样获得的。请注意,当且仅当v(t)=0时,状态q(t)设置为0。我们观察到,与DAX相比,外滩未来的分布范围更广、更平滑,相反,DAX更集中于较小的队列大小。这是我们观察到的不同蜱虫大小的直接结果。0 25 50 75 100 125 150q0.0000.0050.0100.015密度0 5 10 15 20 25q0.000.050.100.150.200.25密度图1(10)中定义的队列状态的经验分布(以AES为单位测量)。左:外滩未来。右图:DAX未来。一旦确定了pref、Q±1和Q±1,我们将每天划分为prefis恒定的时段。然后,每个周期被视为一个独立样本,我们通过数值优化所有获得的独立样本的联合对数似然来确定模型的参数。总的来说,外滩有1207099个周期,DAX有417581个周期。请注意统计估计目的,在下面报告的结果中,我们只考虑了至少总共包含20个事件的样本,而忽略了其他事件。注意,如果sk表示实现的长度k,kt表示时间t附近的实现指数,则数量τm=Esk公司E[sk]表示实现的平均长度ktif随机选择t(即具有统一概率)。当在固定的时间网格{tj}j上进行平均时,这个数量是相关的。对于外滩,我们有τm\'100 s,而对于DAX,我们估计了τm\'16 s。正如我们上面指出的,为了估计我们的模型,我们需要确定指数衰减的数量以及衰减β本身的值。

16
大多数88 在职认证  发表于 2022-6-11 11:46:37
取U=3,设β=60s-1,β=1500s-1,β=5500s-1外滩,β=40秒-1,β=2100秒-1,β=5200秒-1对于DAX。我们实验了bundle AIC BIC#参数SQR 2.046×10-4.093 × 10-4.092×10QRH 2.055×10-4.110 × 10-4.110×10DAXL AIC BIC#参数SQR 7.268×10-1.453 × 10-1.452×10QRH 9.506×10-1.901 × 10-1.901×10表2:Bund和DAX数据的三个考虑模型的对数似然、AIC和BIC值。对数似然差df p-valueH=QR,H=QRH 3.7·1027<10-16d对数似然差df p-valueH=QR,H=QRH 1.8·1027<10-16表3:零假设为QR模型和零假设为标准霍克斯模型的情况下的似然比检验统计量和p值。“自由度”(“df”)值表示两个模型之间参数数量的差异。对于U和β的几种组合,我们发现这些组合代表了待估计参数总数(参数α的数量随U线性增长)和模型优度之间的良好折衷,通过(惩罚的)对数似然测量。最大似然法允许我们根据拟合优度对QR和QRH-I模型进行定量比较,这是本文的中心结果之一。为了完整性,我们还考虑了一个标准的霍克斯模型,即不依赖于队列状态。在表2中,我们报告了三个模型的对数似然值以及Akaike信息准则(AIC)得分AIC=2k- 2L(11)和Schwartz信息准则(BIC)scoreBIC=k log N- 2L(12),其中k是参数数,L是对数似然,N是总样本量(在我们的案例中,事件数)。这些分数允许人们根据其可能性比较嵌套模型,同时考虑不同数量的参数(分数越低越好)。

17
nandehutu2022 在职认证  发表于 2022-6-11 11:46:40
通过查看表2中报告的值,我们观察到QRH-I模型在AIC和BIC方面对这两种资产都有更好的得分。我们还可以使用似然比检验来比较模型。事实上,当所有α都设置为零时,QRH-I模型将简化为QR模型。同样,QRH-I模型简化为标准霍克斯模型,`, u`(q)=u`,即不再依赖队列状态。我们报告了测试统计lr=2(L(^θ)- L(^θ))(13),其中^θ和^θ分别是空模型和备选模型的最大似然估计,以及表3中似然比检验的p值。我们注意到,与QRH-I模型相比,QR模型和Hawkesmodel模型均被拒绝,具有非常高的显著性。为了完成模型的拟合优度比较,我们研究了事件间时间分布。特别是,在图2中,我们通过分位数-分位数图将经验事件间时间分布与校准QR和QRH-I模型模拟产生的时间分布进行比较。从图中可以清楚地看出,QRH-I模型能够更好地再现经验事件间分布,这表明,为了建立一个可靠的订单流量模型,包括对过去事件的依赖是至关重要的。4.3.2.1经验分位数的对数,模拟分位数的对数(s1)543210,经验分位数的对数(s1)QRH模型QR模型,模拟分位数的对数(s1)43210,模拟分位数的对数(s1)QRH模型QR模型图2:事件间时间的对数qq图。模型模拟的事件间时间分位数对数(水平)与经验分位数对数(垂直)绘制。左:外滩未来。

18
nandehutu2022 在职认证  发表于 2022-6-11 11:46:43
右:DAXfuture。本节中的结果表明,LOB状态依赖性和订单流中的相关性导致的记忆效应都是需要考虑的相关变量,以便为订单簿动态建立一个可靠的模型。至关重要的是,以霍克斯项的形式添加一个顺序流量依赖性,可以显著提高模型的可能性及其再现观测到的事件间时间分布的能力。状态相关性和霍克斯矩阵经验估计在图3中,我们报告了QR模型的估计参数u(q),而在图4中,我们绘制了QRH Imodel(4)的类似数量。在比较这些图时,我们可以作两个一般性评论。首先,我们注意到两个模型捕获的队列大小的依赖关系大致一致,因为函数u`(q)在两个模型中具有相似的形状。然而,让我们注意到,QRH Imodel中估计的值要小得多,这表明强度的很大一部分现在是由自激励和交叉激励的Hawkes分量解释的(见下面的讨论)。人们可以注意到,外滩和DAX的结果之间存在一些差异,很可能是由于大型和小型tick资产典型的不同订单动态造成的。正如【16】中所述,我们观察到随着队列大小的增加,市场订单到达率下降。这可以解释为代理倾向于快速消耗流动性,而这种流动性变得罕见。我们还发现,当q(t)足够大时,取消率是队列大小的递增函数。这是在大多数以前的LOB模型中假设的预期特征(参见[25,9]),因为取消更有可能发生在多个有效限额订单的情况下。如附录A.1所示,这种行为确保了队列过程的遍历性。

19
可人4 在职认证  发表于 2022-6-11 11:46:46
最后,让我们注意到,与[16]中观察到的特定股票行为不同,我们没有观察到limitorder插入的强度几乎与队列大小无关。这是队列大小的递减函数,可能反映了当q较大时,对优先级的要求较低。看看数量e`(q)=1也很有趣-u`(q)∧`(q)(14),其中∧`(q)=Eλ`(t)| q(t-) = q(15) 是给定状态下的平均强度q。e`(q)对应于内生自激励和交叉激励机制解释的总平均强度的分数,作为队列大小q的函数,而∧`(q),在QR模型的情况下,由参数u`(q)直接提供,对于QRH-I模型,它由基线强度u′(q)和霍克斯相互作用的贡献给出。与标准的多元Hawkes过程不同,QRH-I模型的参数不允许∧`(q)的封闭式公式。因此,虽然QR模型的e`(q)通常为零,但我们采用∧`(q)的数值计算来计算QRH-I模型的e`(q)。结果如图5所示,其中我们绘制了所有类型订单以及外滩(顶部面板)和DAX(底部面板)期货的估计e`(q)。总的来说,我们看到,从60%到80%的总平均强度中,很大一部分是由自我和交叉刺激效应解释的。We0 20 40 60q23456L,s10 20 40 60q0.00.51.01.52.02.53.0C,s10 20 40 60q0.00.51.01.52.0M,s10.0 2.5 5 5.0 7.5 10.0 12.5q1.01.21.41.6L,s10.0 2.5 5 5 5 7.5 10.0 12.5q0.00.51.01.52.0C,s10.0 2.5 5 5 5 7.5 10 10.0 12.5q0.00.10.30.4M,s10图3:从左至右:限额订单插入、限额订单取消和市场订单的估计值uqf,QR模型。第一排:外滩未来。

20
能者818 在职认证  发表于 2022-6-11 11:46:49
最后一行:DAX未来。0 20 40 60q0.250.500.751.001.251.50L,s10 20 40 60q0.00.20.40.6C,s10 20 40 60q0.00.10.20.30.4M,s10.0 2.5 5 5.0 7.5 10.0 12.5q0.30.40.50.60.7L,s10.0 2.5 5 5 7.5 10.0 12.5q0.00.20.60.8C,s10.0 2.5 5 5 5 5 5 7.5 10.0 12.5q0.000.050.100.15M,s1图4:从左到右:限额订单插入、限额订单取消和市场订单的估计值uqf,QRH模型。第一排:外滩未来。最后一行:DAX未来。请注意,对于取消订单和市场订单,当队列较小时,强度最大程度上由霍克斯术语解释。这很可能是由于订单流的持续性,尤其是我们在图6中指出的自激项的相关性,在市场和取消订单的情况下,这会导致清空队列。观察结果证实了这一解释,即极限阶的相反效果,即q值越高,内生性越高。为了完成QRH模型结果的分析,在图6中,我们在彩色地图中绘制了霍克斯核规范|φ\'m |=R∞φ\'m(t)dt。注意,在我们的设置中,这些量仅由|φ\'m |=PUu=1α\'mu给出。如【5】所述,这些数量表示M型(列)事件对`(行)型事件强度的平均直接影响。订单簿事件的Hawkes核矩阵在[4,23]中得到了广泛的研究。在此,我们注意到,尽管添加了队列依赖项,但我们恢复了先前研究中已经观察到的许多特征,例如与自激相对应的强对角分量,这可能是顺序分裂策略导致的顺序流相关的结果。我们还确认,市场订单对流动性的影响远大于对流动性的影响。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 17:02