楼主: 能者818
2268 45

[量化金融] 订单流的队列反应Hawkes模型 [推广有奖]

21
能者818 在职认证  发表于 2022-6-11 11:46:52
特别是,由于我们在这本书的同一面看互动,我们注意到市场秩序对取消平均有令人兴奋的影响。正如在上述研究中所观察到的,给定价格下的市场订单波动表明,“真实”价格更接近该方,0 20 40 60q606570758085eL、%0 20 40 60q7580859095100eC、%0 20 40 60q60708090100eM、%0.0 2.5 5 5 5.0 7.5 10.0 12.5Q5055606657075EL、%2.5 5 5 5.0 7.5 10.0 12.5 Q55606570758085EC、%2.5 5 5 5 5.0 10.5 Q455505560EM、,%图5:从左到右:QRH模型下,限额订单插入的内生分数,公式(14)中定义的e`(q),限额(`=L),取消(`=C)和市场(`=M)订单。第一行:Bundfuture。最后一行:DAX未来。L C MLCM0.150.300.450.60L C MLCM0.150.300.450.60图6:外滩期货(左)和DAX期货(右)的核范数矩阵。因此,流动性进行了调整,取消了未完成的订单,以免被逆向选择。均衡和经验队列大小分布在参考文献[16]中,作者强调QR模型提供了一个简单的框架来解释在theorder book中观察到的队列大小分布。为此,他们表明,模型不变分布非常符合经验法则,尤其是在第一次出价/要价水平。在附录A.1中,我们表明,在一些似乎经验丰富的条件下,QRH-I模型也是一个遍历过程,队列大小角可以通过其不变分布来描述。在比较QR和QRH Imodels在预测均衡队列大小分布方面的性能之前,让我们强调在解决此问题时需要谨慎。

22
nandehutu2022 在职认证  发表于 2022-6-11 11:46:55
事实上,这种分布,即使以指数速度达到,也必然符合经验观察到的队列定律,因为当队列为空时,参考价格的变化概率不为零。这直接意味着,对于队列大小的较小值,不变分布不应该解释从经验书本状态快照中观察到的值。此外,由于初始队列大小没有理由用变量分布来绘制,因此该定律仅在短暂延迟后才适用,该延迟必须与每次实现的长度进行比较,即参考价格两次变化之间的时间段。然而,遍历定理中涉及的指数率很难估计,可以使用一个代理,例如经验队列大小自相关函数的指数衰减。这是混合系数的另一种度量方法,在某些条件下,它可能与分布弛豫时间有关[7]。假设队列大小的自相关衰减采用ρ(t)=a exp的形式-t/τc,我们从实证上得出,τc’15 s用于外滩未来,τc’2 s用于DAX。对于这两种资产,必须将这些相关性特征标度与平均实现长度进行比较,即外滩的τm’100 s和DAX的τm’16s。因为在这两种情况下,我们都有τc τm,不变量分布很可能与在随机选择的时间观察到的队列大小分布有关。考虑到之前的观察结果,我们现在开始比较经验队列分布,通过每30秒拍摄一次书的快照来测量,以及QR和QRH-I模型产生的不变分布。

23
能者818 在职认证  发表于 2022-6-11 11:46:58
由于我们没有任何明确的QRH-I模型公式,我们通过长时间的模拟来估计q(t)的变化分布。QR模型的不变度量可以通过图3中u`(q)的估计值,使用秒的分析公式直接推导出来。参考文献【16】第2.3.3条。图7显示了Bund和DAX的QR和QRH-I不变度量图以及经验队列大小分布图。首先,我们观察到,QRH-I模型在这两种情况下提供了比QR模型更好的经验数据,尤其是在尾部区域。后者与外滩数据的大样本中观察到的分布尤其相去甚远。其对较小的tick资产(DAX)的表现更接近于[16]中所报告的股票数据结果。除了难以解释大小蜱类资产之间的这种显著差异之外(尽管[16]中的分析公式表明,当u`(q)函数的相应行为发生变化时,分布的整体形状可能会发生很大的变化),我们的发现表明,考虑队列反应模型中的霍克斯自交互不仅对正确描述订单流量动态,但也为队列大小分布提供了更好的模型。0 20 40 60 80 100 120 140q0.000.010.020.030.040.050.060.07密度经验分布QR模型QRH模型0 5 10 15 20 25q0.000.050.100.150.200.250.30密度经验分布QR模型QRH模型图7:QR和QRH模型的不变分布与经验分布的比较。左:外滩未来。右图:DAX未来。我们进一步注意到,QRH-I模型模拟的队列大小分布偏离了经验分布,尤其是在队列较小的状态周围。

24
大多数88 在职认证  发表于 2022-6-11 11:47:01
如前所述,当队列为空时,参考价格很有可能发生变化,因此相应的经验样本将停止。这导致了与“理论模型”相关的统计偏差,其中不存在此类事件类型,因为当队列为空时,直到新的限制指令到达,才会发生任何事情。因此,与非经验观测相比,模型中更有可能访问队列值较低的状态。3 TheOrderBook最佳限额的队列反应式霍克斯模型在上一节中,我们提出了一个具有固定价格的单一最佳限额的模型,即当最佳限额的价格发生变化时,该模型存在。因此,它既不考虑两个最佳限额(最佳出价/最佳出价)之间的交叉动态,也不考虑其相应价格的变化。本节致力于解决这些缺点的模型。这两个最佳限额都是与中间价格变化一起建模的。因此,与之前的模型(以及[16]中提出的模型)相反,模型的重置仅在市场收盘时发生。这个新模型是通过在Bacry等人的模型中添加queuedependency来构建的。上一节的模型被称为QRH-I(单侧LOB建模),此新模型将被称为QRH-II(双侧LOB建模)。3.1 QRH-II模型:将队列依赖性添加到Bacry等人的模型中[4]作者考虑了LOB最佳级别的八种事件类型,即P+(P-) 对于根据此次变动的规模独立上调(下调)中间价的活动,对于不改变中间价的最佳询价(出价)限价订单,La(Lb),对于不改变中间价的最佳询价(出价)取消订单,Ca(Cb),对于不改变中间价的最佳询价(出价)市场订单,Ma(Mb),其中,对于任何`∈ {P+,P-, La、Lb、Ca、Cb、Ma、Mb},最佳ask(分别为。

25
能者818 在职认证  发表于 2022-6-11 11:47:04
bid)级别是指ask(resp.bid)侧的非空级别。让我们定义与事件相关的计数过程,以键入“和λ”(t)相关的条件强度。让我们指出,LOB的第一个限制的描述与前一节或[16]中所采用的方法有很大不同,其中最佳限制队列大小可以为0。此外,该模型不再需要定期重置,也不使用任何参考价格优先的概念。【4】中的作者考虑了一个多变量霍克斯模型,其中每种事件类型都可以影响其他事件类型,并受到其他事件类型的影响,因此条件强度读数为:λ`(t)=u`+XmZtφ` m(t- s) dNms,(16),其中`和m可以取8个值{P+,P-, La、Lb、Ca、Cb、Ma、Mb}。在他们的工作中,使用文献[6]中首次描述的非参数估计方法估计核φ。该模型允许作者强调限额订单簿中事件之间的丰富影响结构,包括高频中间价反转和订单分割策略确定的订单流中的持续自相关,以及一些更明确的做市商诱导动态(见[4])。为了将队列依赖性添加到之前的霍克斯方法中,我们以与前一节中大致相同的方式进行操作,除了订单簿状态不再由单队列数量q(表示最佳ask或最佳bid数量)表示,而是由最佳bid和最佳ask队列大小(qa、qb)表示。让我们指出,现在队列大小Qa和qb,根据定义,永远不会达到零,而且每个进程dN `编码在相应的最佳侧发生的所有类型事件的完整历史,独立于最佳询价/投标价格的各种移动。

26
可人4 在职认证  发表于 2022-6-11 11:47:08
因此,将队列依赖性添加到这样的模型需要一种机制,该机制不仅能够调节(作为电子书状态的函数)外部强度u`(如前一个模型中所述),而且能够调节强度的霍克斯部分。为了说明这一点,我们可以提到一种情况,显然Hawkes kernelmatrix应该明确地依赖于队列状态:例如,当ask队列较大而bid队列较小时,P+事件极不可能发生(对于较大的tick资产)。我们考虑了最简单的可能性,即强度的外生部分和自激部分对状态具有相同的乘法依赖性,并引入了以下模型,称为QRH-IIλ`(t)=f `(qa(t),qb(t))u`+XmZtφ` m(t- s) dNms!,(17) 其中,编码对订单状态依赖性的函数f `不仅调节异源强度(如等式(4))而且调节霍克斯项。让我们注意到,与QRH-I模型不同,QRH-II模型主要是订单流量的模型,因此我们忽略了订单到达量和队列大小之间的关系,并将这些队列视为(可观察的)外部过程。如前所述,我们为核φ\'mand选择了一种参数形式,特别是我们采用了等式(6)中提供的相同指数总和规格。我们记得,中间价对应于最佳询价与最佳出价的平均值。3.2从对数似然估计到最小二乘估计核的参数形式(6)已经指定,可以使用MLE估计模型。虽然QRH-II模型与QRH-I模型略有不同,但其对数似然函数及其梯度的计算遵循附录A.2中所述的相同轨迹,只需进行心房修正。

27
能者818 在职认证  发表于 2022-6-11 11:47:11
此外,由于选择了参数化,对数似然是参数的凸函数,从而保证了全局最优解的存在。由于订单簿状态的配置数量在每侧考虑的状态数量中呈二次增长,如果该数量太大,则可能会出现问题。考虑每个可能的属性(即每个队列的每个可能值)将需要很长的计算时间。为了限制配置数量,如果出价队列大小在其第i个五分位数(即25·i百分位数)内,而询问队列在其第j个五分位数内,则我们认为订单处于状态(qia,qjb)。因此,估计函数f′实际上是五分位数f′(qia,qjb)的函数。最后,我们选择标准化(注意,任何其他标准化都相当于重新调整内核和公式(17)中的u′)f′(qa,qb)=1。(18) 使用最大似然法,我们在上一节中使用的相同数据集上校准如此获得的模型。如表4和表5所示,当使用指数核之和进行校准时,我们的模型在拟合优度方面优于[4]中引入的纯霍克斯模型。

28
何人来此 在职认证  发表于 2022-6-11 11:47:14
特别是,似然比检验拒绝了p值<10的纯霍克斯模型的无效假设-16.BUNDLE AIC BIC#参数SQRH II 5.348×10-1.070 × 10-1.070×10霍克斯5.200×10-1.040 × 10-1.040×10DAXL AIC BIC#参数SQRH II 4.626×10-9.253 × 10-9.253×10霍克斯4.488×10-8.976 × 10-8.976×10表4:Bund和DAX数据的QRH-II模型(由(17)定义)和霍克斯模型(由[4]定义)的对数似然、AIC和BIC值。捆扎机df p值H=霍克斯,H=QRH-II 2.9·10200<10-16DAXLR df p-valueH=霍克斯,H=QRH-II 2.8·10200<10-16表5:零假设为QRH IImodel(由(17)定义)和零假设为Hawkes model(由[4]定义)的情况下的似然比检验统计量和p值。P+pmamblabcacbp+pmamblabcacb0.00.20.40.60.81.0P+pmamblabcacbp+pmamblabcacb0.00.20.40.60.81.0图8:QRH II模型的MLE核范数矩阵rφlm(t)dt(左)和DAX future(右)(由(17)定义)。第3.3节将详细讨论由此获得的MLE结果。现在,为了简单起见,让我们先把队列依赖性的影响分开,看看内核估计。图8表示由此获得的核范数矩阵{Rφ\'m(t)dt}}}由我们的模型给出。该图将与[4]图4中获得的矩阵进行比较,其中使用了相同的模型(无排队依赖关系)。让我们指出,为了获得该矩阵,[4]进行了非参数估计,该估计允许核的负值,从而允许矩阵{Rφ\'m(t)dt}\'m的某些元素的负值。这些负值说明了抑制动力学,即降低给定类型事件的强度。

29
nandehutu2022 在职认证  发表于 2022-6-11 11:47:16
我们可以证明,在某些情况下,内核的负值可能会在某个特定时间(且概率非零)出现,其中总和(17)为负,导致负强度,当然,这没有任何意义。为了避免这一困难,通常用λ`(t)=f `(qa(t),qb(t))u`+XmZtφm(t)形式的非线性方程代替方程(17- s) dNms!+,(19) 其中运算符(…)+如果此数量为正,则不更改括号之间的数量值;如果此数量为负,则为0。然而,在这种非线性霍克斯模型的框架下,极大似然估计不再是一个凸问题,因此变得很难处理。如【14】所述,当考虑最小二乘法时,这个问题在某种意义上是可以处理的(另请参见【24】关于负值核最小二乘估计的示例)。因此,最小二乘估计允许负值核,而在上述MLE框架中,我们强制所有核(即等式(6)中的所有αlmu)为正值。这主要解释了【4】中的图4和我们的图8之间的差异。为了命名一个显著的差异,在[4]中,核积分φLbP-(分别为RφLaP+)被发现是强负的。实际上,如文献[4]中附录B.6所示,内核本身φLbP-(分别为φLaP+)在所有时间尺度上都是最负的。

30
kedemingshi 在职认证  发表于 2022-6-11 11:47:19
这一事实可以被看作是做市商诱发的一种自然动态:当价格下跌时,有效价格更接近最佳出价,因此在出价规模上下达的限价订单更少(与发送激进订单相比,收益很小),而在询价方下达的限价订单更多。让我们指出,强制核只有正值(即,在执行MLE时,强制所有αlmuto都为正值)将先验地不仅导致具有负值的核的高偏差值,而且还可能导致仅具有正值的核的高偏差,因为所执行的估计是对所有涉及复杂这些核之间的关系(有关此类偏差的示例,请参见[6])。因此,似乎应该使用基于最小二乘的估计,而不是MLE。有关最小二乘估计的详细信息,请参见附录A.3。它包括将R(θ)最小化为R(θ)=DX`=1R`(θ),R`(θ)=ZTλ`(t;θ| Ft)dt-N\'Xk=1λ\'(t\'k;θ| Ft\'k)(20),其中λ\'由公式17给出。可以很容易地验证这个问题作为αulm的函数是凸的(见等式(6)),因此可以保证全局最优解的存在。如附录A.3所示,该参数化允许在计算上高效地计算平方损失函数R及其梯度。3.3拟合结果和评论在本节中,我们展示并评论通过等式(17)定义的QRH II模型的最小二乘估计获得的结果。f`(qa,qb)函数的估计。在我们的结果中,我们记录了订单到达率对QIA和qjb的明显依赖性,表明LOB的状态对订单到达率有明显的影响。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 17:02