楼主: mingdashike22
1687 47

[量化金融] 微观结构极限订单模型中的算法交易 [推广有奖]

31
可人4 在职认证  发表于 2022-5-31 11:34:44
,N,其中Eat,z[.]表示由事件TVQn=t、ZVQn=z和在时间t时作出决定In=a所条件的期望。我们编写了Qknn算法的伪代码,以计算算法1中的(BVQN,D)。算法1通用Qknn算法输入:–N:时间步数–z:时间T=0时E的状态–ε={E,…,eL}和(p`)L`=1:(εN)Nn的最佳量化的网格和权重=1ΓandΓenth用于分别投影时间n和状态分量的网格,对于n=0,N1: 对于n=n- 1.0 do2:计算时间n时的近似Qknn值:^Qn(z,a)=r(Tn,z,a)+LX`=1p` bVQn+1项目G(z,e`,a),ΓTn+1, 项目F(z,e`,a),ΓEn+1,对于(z,a)∈ Γn×Az;3: 计算时间n^An(z)的最优控制∈ 阿格米纳∈Az^Qn(z,a),代表z∈ Γn,其中argmin很容易计算,因为所有z∈ E4: 通过量化值函数进行分析估计:bVQn(z)=^Qnz、 ^安(z), z∈ Γn;5: 输出结束:–(bVQ):估计V(0,z);我们在备注4.3中讨论了我们可以应用定理4.1的原因。备注4.3当LOB的跳跃次数为N时≥ 1是固定的,可以通过跳跃少于N次来获取受控订单簿的所有状态集(在续集中用K表示)是固定的。因此,(3.6)中定义的奖励函数r是有界的,并且Lipschitz在K上。以下命题表明,VVQ,(N,D)N是由时间离散化、K-最近邻和最优量化方法组合而成的,是时间Tn时值函数的一致估计量,对于N=0,N- 它为值函数的Qknn估计提供了收敛速度。命题4.1 Qknn算法提供的值函数的估计量是一致的。此外,它保持为M→ +∞:VVQ,(N,M)NTVn,ZVn- 越南Tn、ZnM、 2=OαN+M2/d, 对于n=0。

32
nandehutu2022 在职认证  发表于 2022-5-31 11:34:47
N- 1,其中,我们用k.kM表示2由训练集调节的L(u)范数,该训练集已用于构建估值器VVQ,(N,M)N+1。证据将时间切割误差和量化误差分开,得到:kVnTn、Zn- VV(N,M)NTVn,ZVn公里,2≤ kVn公司Tn、Zn- V(N)NTn、ZnkM,2+kV(N)NTn、Zn- VV(N,M)NTVn,ZVn公里,2。(4.8)步骤1:应用引理3.2,我们得到(4.8)的r.h.s.中第一项的以下界限:kVnTn、Zn- V(N)NTn、Zn公里,2≤αN1- αkbk∞, (4.9)其中kbk∞表示b在[0,T]×E上的上确界。步骤2:注意,如备注4.3所示,满足定理4.1的假设,因此后者为(4.8)的r.h.s.中的第二项提供了以下界:V(N)NTn、Zn- VVQ,(N,M)NTVn,ZVnM、 2=米→∞OM2/天. (4.10)仍需将(4.9)和(4.10)插入(4.8),以完成命题4.1.4.4的证明。数值结果在本节中,我们提出了几个设置来测试Qknn在模拟订单上的效率。我们不接受连续报酬,即f=0,并将做市商在清算其库存后的财富作为最终报酬,即g(z)=x+L(y)。在第一次测试中,强度保持不变,在第二次测试中,强度取决于状态。状态依赖强度的值与Huang et al.(2015)中的值相似(见)。尽管出于可预测性的原因,第3节假设强度不受控制,但在本节中,后者是受控制的过程,即订单到达的强度取决于订单簿中所有参与者的订单加上做市商的订单。

33
可人4 在职认证  发表于 2022-5-31 11:34:50
最优交易策略已计算0 10 20 30 40 5000.511.522.533.5队列大小(每平均事件大小)强度(每秒数)限制订单插入强度,模型I第一限制第二限制第三限制0 10 20 30 40 5000.10.20.30.40.50.60.70.80.9队列大小(每平均事件大小)强度(每秒数)限制订单取消强度,第一类限制第二类限制第三类限制10 20 30 40 50-0.0500.050.10.150.20.250.3队列大小(每平均事件大小)强度(每秒数量)市场订单到达强度,第一类限制第二类限制第三类限制图2:强度值w.r.t.第4.4节数值试验中使用的队列大小。该图摘自Huang et al.(2015)(见图13)。作者使用阿尔卡特朗讯公司的数据对强度进行了估算。在两类不同的策略中:在第4.4.1节中,我们测试了算法,以接近那些做市商仅允许在最佳出价和最佳询价下订单的策略中的最优策略;在第4.4.2节中,我们计算了做市商允许自己在订单簿两侧的两个最佳限额下订单的策略类别中的最佳交易策略。请注意,第二类控制比第一类更一般。该代码在上可用https://github.com/comeh.The使用Qknn算法估计条件期望时产生的k个最近邻的搜索非常耗时;尤其是在考虑的10维以上的市场营销问题中。Qknn的效率在很大程度上取决于用于在高维中查找k个最近邻居的算法。

34
可人4 在职认证  发表于 2022-5-31 11:34:53
我们使用近似近邻算法快速库(FLANN)实现了该方法,该库引入了inMuja和Lowe(2009),并且已经作为C++、Python、Julia和许多其他语言的库提供。该算法基于树方法。请注意,基于graphalso的最新算法性能良好,也可以使用。4.4.1。案例1:做市商仅以最低价和最低价下单。用A1lim表示仅允许在最佳询价和最佳报价上下单的控制类别。我们实现了Qknn算法来计算A1lim中的最优策略。然后,我们将最优策略与天真策略进行了比较,天真策略包括始终以最佳出价下一个订单,以最佳要求下一个订单。朴素的策略在图中被称为11,可以被视为基准。当订单到达强度的模型是对称的,即投标和投标的强度相同时,朴素策略是一个很好的基准。事实上,在这种情况下,做市商可以预期获得平均价差。在图3a中,我们采用恒定强度来模拟限额和市场订单到达,并采用线性强度来模拟取消订单。在这种情况下,正如我们在图中所看到的,使用Qknn算法计算的策略与朴素策略的性能一样好。请注意,显然,市场制定者必须为状态量化获取足够的分数,以便Qknn算法能够很好地执行。在图3b中,我们绘制了做市商的损益图,当做市商仅使用6000个点来计算状态空间离散化的最优策略时,对于如此少的网格点,Qknn算法表现不佳。

35
何人来此 在职认证  发表于 2022-5-31 11:34:57
在此设置中,请注意,栅格的(a)10点。(b) 6000个网格点。图3:遵循Qknn估计最优策略(Opt)和朴素策略(11)时的损益直方图。我们采用对称和恒定的强度,短终点时间t=1。请注意,Qknn策略旨在通过减少构建网格时的损失来改善损益(见图3a),如果构建网格时使用较少的点,其性能会更差(见图3b)。天真的策略似乎表现良好。在图4中,我们使用QKNN估计的最优策略绘制了做市商损益的经验柱状图,使用大小为N=10、10、10、10的网格计算状态空间离散化;以及使用naivestrategy的做市商损益的经验柱状图。我们采用了依赖于状态的强度。可以看出,网格的大小越大,最优策略的Qknn估计就越好。在图5中,我们按照Qknn估计的最优策略和朴素策略绘制了做市商的损益图。我们采用与图4中相同的参数来运行模拟,但终端时间除外,我们将其设置为等于T=10。在此设置中,Qknn estimatedoptimal策略的性能比naive策略好得多,这突出了naive策略并非最优的事实。我们在图6中绘制了Qknn在市场动态中加入趋势时的反应。在本例中,我们采用的卖出市场订单的强度高于买入市场订单的强度,这在价格动态中创造了一种艺术性的积极趋势。请注意,QKNN正确理解,最好不要在价格上涨时出售。4.4.2。案例2:做市商在订单簿的前两个限额下订单。

36
mingdashike22 在职认证  发表于 2022-5-31 11:35:01
我们将可接受控制的类别扩展到做市商在订单簿的买卖双方的前两个限制上下订单的控制。用A2lim表示后者。我们在A2lim上对Qknn算法进行了仿真测试。在图7和图8中,我们绘制了做市商遵循三种不同策略时损益的经验分布图:o在A2lim(PLOpt2lim)中Qknn估计的最优策略Qknn估计了A1lim(PLOpt1lim)中的最优策略天真的策略,即始终将订单放在最佳出价和最佳询问队列上(PL11)。请注意,当可接受的控制类别扩展时,做市商的损益总是更好,见图7;但在一些数值试验中,扩展的控制组似乎没有改善损益。事实上,我们观察到,使用Qknn amongA2lim和A1lim估计的最终损益在试验中具有类似的经验分布,其结果如图8所示。(a) (b)(c)(d)图4:做市商遵循Qknn估计最优策略(Opt)和朴素策略(11)时的损益直方图。强度λM、λlian和λCidepend取决于订单簿的状态。当遵循Qknn估计的最优策略时,做市商的损益使用网格的10、10、10和10点进行计算:分别见图4a、4b、4c和4d。读者可以看到,做市商通过在状态空间离散化中获得越来越多的分数,增加了他们的预期终端财富(清算后)。此外,当强度依赖于状态时,Naive策略被击败。图5:当做市商遵循最优策略(深蓝色)和朴素策略(浅蓝色)时的损益分布。我们采用对称和依赖于状态的强度;和长期终止时间:T=10。

37
何人来此 在职认证  发表于 2022-5-31 11:35:04
注意,当强度依赖于状态时,Qknn策略比朴素策略做得更好。图6:Qknn对LOB中艺术性积极趋势的反应。y轴表示做市商在询价侧发送的订单与订单簿中在询价侧和报价侧发送的订单的比率。x轴表示最佳ask限制大小与最佳出价和最佳ask限制大小之和的比率。蓝点是市场上没有趋势的点。橙色点是那些在市场上有积极趋势的点。我们可以看到,Qknn在其决策中正确地考虑了趋势:对于两个相同的订单,当价格预计上涨时,Qknn不太愿意出售。图7:遵循最优策略和幼稚策略的做市商损益(PL11)。终端时间短。市场订单到达的非对称强度:买入市场订单过程的强度高于卖出市场订单过程的强度。做市商在订单簿两侧的前两个限额下订单时,其财富更大,而不是仅在出价和askside的最佳限额下订单时。5、霍克斯过程的模型扩展我们在本节中考虑了一个做市商,其目标是最大化其终端财富的函数,如果订单到达是由霍克斯过程驱动的,则在终端时间T惩罚其库存。让我们首先介绍LOB的霍克斯过程模型。LOB模型:我们假设订单簿接收限制、取消和市场订单。我们用L+(分别为L-) 限价订单到达处理ask(resp.bid)端;通过C+(分别为C-) ask(resp.bid)侧的cancelorder;和M+(分别为M-) 买入(或卖出)市场订单到达流程。

38
mingdashike22 在职认证  发表于 2022-5-31 11:35:08
在本节中,我们假设到达的极限订单遵循Hawkes过程动力学,并且我们假设核是指数的。然后,通过(4K+2)变量Hawkes过程(Nt)对订单到达进行建模,该过程具有外生强度λ和指数alkernelφ的向量,即φij(t)=αijβeβtt≥0、图8:遵循最优策略或朴素策略时的损益(PL11)。长期有效期。市场订单到达的对称强度。量化4.10分。请注意,在扩展控制类别上计算的Qknn策略,即在两个第一限制(StratOpt2lim)上的下单,与在原始控制类别上计算的Qknn策略,即在最佳出价和最佳询问(StratOpt1lim)上的下单,执行得一样好。设α=(αij)i,j。我们假设:(α)i,jt的谱半径严格小于1,这是保证模型平稳性和E[λu | Ft]收敛为u的有效条件→ +∞,如霍克斯(1971)所示。注意,在所提出的模型中,以下情况成立:(Hλ)λ假定与控制无关。用D=4K+2表示(Nt)的尺寸,即(Hλ)下Ntwrites强度λ的mth分量:λmt=λm+DXj=1αmjZte-β(t-s) dNjs,对于m=1,D、 众所周知,对于这种强度选择,耦合(Nt,λt)t≥0变为马尔可夫,参见Massouli'e(1998)中的引理6,以获得该结果的证明,此外,我们有:dλmt=-βDλmt- λmdt+DXj=1αmjdNjt,对于m=1,D、 给定初始条件:λm∈ R*+对于m=1,D、 我们现在可以重写控制问题(3.1),在特定情况下,订单簿由霍克斯过程驱动,没有连续奖励,即f=0,并且终端回报代表做市商的终端财富被其库存惩罚。

39
能者818 在职认证  发表于 2022-5-31 11:35:12
然后,我们在本节中考虑以下问题:V(t,λ,z):=supα∈AEαt,z,λGZT公司, (5.1)其中G(z)表示当受控指令簿处于z状态时做市商的财富,加上对其存货的处罚期限;其中A是一组可接受的控制,即做市商在终端时间T>0之前做出的可预测决策。我们现在介绍本节的主要结果。定理5.1 V的特征是以下HJB方程的唯一解:f(T,z,λ)=G(z),对于z∈ E0=ft(t,z,λ)- DβDXm=1λm- λmfλm(t,z,λ)+λmsupa∈亚利桑那州ft、 eam(z),λ+αm- ft、 z,λ,对于0≤ t<t,和(t,z,λ)∈ R+×E×R*+.(5.2)式中,αm=(α1m,…,αDm)。此外,V允许以下表示:V(t,z,λ)=supα∈A.∞Xn=0Eαt,z,λ“Tn≤甘油三酯ZαTn经验值(- |λ|(T- Tn)+DXm=1λmTn- λmDβe-PDj=1βmj(T-Tn)- 1.)#, (5.3)其中,对于n≥ 0,Tn代表时间t后Z的第n次跳跃时间,和(ZαTn,λTn)∞n=0是由α控制的MDP∈ A.其中Eαt,z,λ[.]表示当遵循控制α时,Zt=z,λt=λ条件下的期望值。备注5.1 V在(5.3)中被描述为与具有完整权限的MDP相关的值函数,其中连续奖励读数为:r(t,z,λ)=1t≤TG(z)膨胀(-|λ|(T- t) +DXm=1λm- λmDβe-Dβ(T-t)- 1.),其中||表示L研发部标准证明:(定理5.1)步骤1:让我们检查(5.3)是否成立,其中V定义为(5.1)的解。首先注意,(λt,Zt)是一个PDMDP,即(λt,Zt)在两个跳跃时间之间是确定的。然后,我们旨在将(5.1)中定义的值函数表达式重写为与PDMDP(λt,Zt)t的有限水平控制问题相关的值函数。

40
kedemingshi 在职认证  发表于 2022-5-31 11:35:16
为此,我们首先注意到,EPDMDP代表分段确定性马尔可夫决策过程,这是一种MDP,其动态在泵之间是确定性的。通过调节时间跳跃,我们得到:V(t,z,λ)=supα∈AEαt,z,λhGZαTi=supα∈AEαt,z,λ∞Xn=0Tn≤T<Tn+1GZαTn= supα∈A.∞Xn=0Eαt,z,λ田纳西州≤甘油三酯ZαTnPT- 田纳西州≤ Tn+1- 田纳西州田纳西州, (5.4)其中田纳西州nis是N的跳跃时间序列。该过程是一个跳跃过程,强度为us=PDm=1λms。由于它保持不变,以FTn为条件:us=DXm=1λm+λmTn- λme-Dβ(s-Tn),用于s∈ [Tn,Tn+1),那么,我们有:PTn+1- 田纳西州≥ T- 田纳西州田纳西州=Z∞T-Tnuse-Rsuududs=经验值(- |λ|(T- Tn)+DXm=1λmTn- λmDβe-Dβ(T-Tn)- 1.). (5.5)将(5.5)插入(5.4),值函数重写:V(t,z,λ)=supα∈A.∞Xn=0Eαt,z,λ“Tn≤甘油三酯ZαTn经验值(- |λ|(T- Tn)+DXm=1λmTn- λmDβe-Dβ(T-Tn)- 1.)#, (5.6),完成步骤1。(5.6)的r.h.s可被视为与PDMDP相关的有限水平控制问题的值函数。步骤2:让我们证明V是(5.2)的唯一解。首先请注意,以下HJB方程的解G(z)=f(T,z,λ)0=ft型-PDm=1Dβλm- λmfλm+λmsupa∈亚利桑那州ft、 eam(z),λ+αm- ft、 z,λ,对于0≤ t<t。是运算符t=t的固定点o T此处和皮重定义如下:T:F 7→ f的解决方案(ft型- DβPDm=1λm- λmfλm=F(t,z,λ)F(t,z,λ)=G(z),且:t:F 7→ -DXm=1λmsupa∈亚利桑那州ft、 eam(z),λ+αm- ft、 z,λ.现在,我们使用特征方法重写T的图像。让我们取函数F,并定义F=T(F)。让我们来确定∈ [0,T]和λ∈ (R+)D,并用g表示函数g(s,z)=f(s,z,λs,…,λDs),其中,对于m=1,D、 s 7→ λMsi是在[t,t]上定义的微分函数,作为以下ODE的解:dλmsds=-Dβλms- λm, 对于所有t<s≤ T、 λmt=λm.(5.7),对于m=1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 13:44