楼主: kedemingshi
1471 52

[量化金融] 市场微观结构及其他方面的控制停止博弈 [推广有奖]

11
可人4 在职认证  发表于 2022-6-1 05:01:01
然而,本文所述的大多数结果适用于更一般的ca/bt和ga/bt,只要它们是由(pat、pbt、Xt)的确定性函数给出的,并且本文进一步说明的适当假设是令人满意的。在拟议的规范中,X代表非战略投资者的“保留价格”的当前估计。每个代理都认为,非战略投资者根据A来到市场,对这个术语的精确解释取决于手头的均衡问题。在此,我们证明了战略主体的连续值由布朗运动的函数给出,第一个导数的界远离零。泊松过程N,强度λ>0,与B无关。在任何到达时间Tiof N,此时到达的非战略投资者的实际保留价格pTi的值由pTi=XTi+ξi给出,其中{ξi}是i.i.d.随机变量,与B和N无关,平均值为0和c.d.f.f。当且仅当pTi时,到达的非战略投资者(向战略卖方)提交购买订单≥ 帕蒂。同样,如果且仅当pTi≤ pbTi。非战略卖家的订单执行后(所有订单均为单位大小),战略卖家的剩余库存(单位大小)在价格bXTi上标记为市价-+ αξic。同样,如果非战略代理人是买方,则战略买方的剩余库存将按dXTi的价格标记为市价-+ αξ即,我们用b·c和d·e表示标准的“地板”和“天花板”功能。参数α∈ (0,1)衡量单一贸易对估计基本价格的(线性)影响。

12
mingdashike22 在职认证  发表于 2022-6-1 05:01:04
如果买卖价差等于一个勾号,则可选择此特定标记规则:在这种情况下,XTi-+ αξire表示保留价格的新估计值(在执行非战略代理的订单之后),而出价和要价是从下到上与该数字最接近的整数。上述规范导致ca/带ga/b的以下表达式:cat(pat,pbt)=cbt(pat,pbt)=c(pat,pbt,Xt),c(pa,pb,x):=λ(1 - F(pa- x) )+Fpb级- x个, (3) gat(pat,pbt)=ga(pat,pbt,Xt),ga(pa,pb,x):=λpa(1- F(pa- x) )+Fb(pb,x), (4) gbt(pat,pbt)=gb(pat,pbt,Xt),gb(pa,pb,x):=λpbF公司pb级- x个+ Fa(pa,x), (5) Fb(pb,x):=Zpb-x个-∞bx+αycdF(y),Fa(pa,x):=Z∞帕-xdx+αyedF(y)。(6) 任何战略代理也可以在任何时候停止游戏,与其他战略代理进行交易,交易价格为后者可接受的价格:如果买方发起交易,则为qa;如果卖方发起交易,则为qbif。这就为战略代理人带来了最优停止问题,即时奖励过程等于(折扣)QA和qb(参见(1)和(2))。即时奖励过程对其他代理的持续控制的这种功能依赖性,给停止策略的定义带来了额外的挑战。为简单起见,假设ca/b≡ 0,注意,如果τa>τb,那么卖方的收益是qaτb。如果τb固定为惊人的时间(卖方已知),那么卖方可以在τb周围增加qa的值,从而使其收益任意大。当然,在实践中,买方不会接受任意高的价格。

13
何人来此 在职认证  发表于 2022-6-1 05:01:07
因此,为了使我们的博弈更加现实,我们假设每个停止策略都取决于其他代理的连续控制,因此改变qa将导致τb的变化。由此产生的控制停止博弈由下式给出(pa,qa,τa)∈ argmaxp∈Aa,q∈A、 τ∈TaE公司Uaτ(qb)(p(X),pb(X),qb(X))1{τ(qb)≤τb(q)}+Laτb(q)(p(X),q(X),pb(X))1{τ(qb)>τb(q)},(pb,qb,τb)∈ argminp∈Ab,q∈A、 τ∈待定Ubτ(qa)(pa(X),qa(X),p(X))1{τ(qa)≤τa(q)}+Lbτa(q)(pa(X),p(X),q(X))1{τ(qa)>τa(q)},(7) 其中Ua/波段La/裸通过(2)和(3)–(6)定义;A是从R到Z的所有可测函数的空间;Aa={p∈ 答:1- F(p(x)- x)≥cl2λ,x个∈ R} ,Ab={p∈ A:F(p(x)- x)≥cl2λ,x个∈ R} ,(8)某些常数cl>0;Ta和Tb由A到FX stoppingtimes,s.t.τ空间的所有映射组成∈ 助教=> FX适应流程v,s.t。q∈ A、 τ(q)=inf{t≥ 0:q(Xt)≥ vt},τ∈ Tb=> FX适应流程v,s.t。q∈ A、 τ(q)=inf{t≥ 0:q(Xt)≤ vt}。上述停止策略的定义反映了第(7)段的结论,并暗示代理的停止规则是“阈值”类型:当对其他代理的持续控制(即报价)变得足够有吸引力时,她停止。通过指定相关阈值v,可以唯一定义TBTAOR中的任何τ。因此,我们有时会使用符号τv。显然,对于任何固定的q∈ A、 任何外汇止损时间都可以用τv(q)表示,并选择适当的v。选择允许的公布价格集Aa/b,以确保非战略代理的订单流动率c(pa,pb,x)(在(3)中给出)远离零。为了确保每个代理的最佳连续控制表现良好,我们做出以下假设(与[9]中的假设2-5相比)。假设1。

14
kedemingshi 在职认证  发表于 2022-6-1 05:01:10
ξ的分布具有密度f,由一个常数Cf>0从上方限定,其支撑是凸的,包含在[-C、 C],对于某些常数C>0。此外,在支架内部,f是连续的,(1- F)/F不增加,F/F不减少。备注1。可以放宽假设1,以便(1-F)/F仅要求在SUP(F)内部不增加∩R+,且supp(F)内部的F/F不递减∩R-. 这需要对建模假设进行微小的改变:即,外部购买订单只能达到p的正跳,而外部出售只能达到p的负跳(除了p≥ PAN和p≤ 分别为pb)。[9]中使用了后一个设置,但我们选择在这里避免它,以便简化符号。此外,如【9】中假设5后的备注所述,假设1的充分条件可以通过f的对数凹度来说明。如导言所述,形式(1)–(2)的博弈无法使用标准方法直接分析。因此,我们的第一个目标是找到一个更方便的方程组来描述(7)的一个子类平衡。为此,我们回顾了价值函数的概念,它代表了所有可容许控制下代理的目标值的上确界或内确界(无论哪一个是合适的)。很容易得出,该值仅取决于初始条件X。假设X=X,让我们分别用“Va(X)”和“Vb(X)”表示卖方和买方的值函数。在平衡状态下,我们自然会期望qa(X)≥(R)Va(x)和qb(x)≤(R)Vb(x):代理人愿意立即交易的最优价格不应低于他们预期的执行价格,如果他们采取最佳行动的话。由于价格取整数值,我们得出结论:qa(x)≥ d'Va(x)e和qb(x)≤ b'Vb(x)c。

15
mingdashike22 在职认证  发表于 2022-6-1 05:01:14
那么,任何代理停止都是次优的,除非“Vb(Xt)”≥ d'Va(Xt)e或'Va(Xt)≤ b“Vb(Xt)c.请注意,后两个不等式中的每一个都描述了相同的事件:间隔[”Va(Xt),”Vb(Xt)]至少包含一个整数。然后,对于每个战略代理人来说,以这个区间内任何整数给出的价格与另一个进行交易是最理想的,对于其中至少一个战略代理人来说,以任何其他价格进行交易是最理想的。如果这样的整数是唯一的,我们就得到了唯一的阈值价格,这样当代理的值函数达到这个阈值时,代理就会(同时)停止。这种启发式讨论通过耦合控制问题的辅助系统激发了对(7)平衡的搜索:Find pa∈ Aa、pb∈ Ab和可测量的“Va”和“Vb”,使得(\'Va(x)=支持∈Aa,τJax、 τ,p,pb,\'Vb= supτJax、 τ,pa,pb,’Vb,(R)Vb(x)=infp∈Ab,τJbx、 τ,pa,p,’Va= infτJbx、 τ,pa,pb,(R)Va,(9) 这是确保游戏不会持续太长时间所需的技术条件,因此,代理的值函数不会偏离X太远(参见,例如,(13)和引理2的证明)。式中,τ在所有FX停止时间内变化,且x、 τ,pa,pb,v= ExhZτexp-Ztc(pa(Xs)、pb(Xs)、Xs)dsga(pa(Xt),pb(Xt),Xt)dt+exp-Zτc(pa(Xs),pb(Xs),Xs)dsbv(Xτ)ci,(10)Jbx、 τ,pa,pb,v= ExhZτexp-Ztc(pa(Xs)、pb(Xs)、Xs)dsgb(pa(Xt),pb(Xt),Xt)dt+exp-Zτc(pa(Xs),pb(Xs),Xs)dsdv(Xτ)ei,(11),其中Ex[·]=E[·| X=X]。提案1。假设(pa、pb、\'Va、\'Vb)、solve(9)和(\'Va、\'Vb)是连续且递增的。然后,(pa,d'Vae,τ'Va)和(pb,b'Vbc,τ'Vb)形成(7)的平衡。证明:该证明包括基本验证,即建议的策略对于(7)中的代理是最优的。以战略卖家为例。

16
kedemingshi 在职认证  发表于 2022-6-1 05:01:16
从qb=b'Vbc这一事实来看≤\'Va,我们很容易推断出(7)中卖方的最大目标值不超过\'Va,前提是其他代理人使用命题陈述中给出的策略。作为“Vb”≤ d'Vae=pa,很容易看出,使用(7)中规定策略的药物都在停止时间τ停止*:= inf{t≥ 0:(R)Va(Xt)=b'Vb(Xt)c},卖方在(7)中的目标值与(10)的关联值一致。“Va”和“Vb”的连续性和单调性意味着:“Va(Xτ)”*) = b'Vb(Xτ*)c、 无论何时τ*< ∞. 然后,最优停止理论中的标准论证得出,(10)的关联值是最优的,因此与'Va一致。类似的论证适用于战略买方。上述命题表明,构建(7)均衡的问题归结为求解(9)。后者是一个由两个马尔可夫控制-停止优化问题组成的系统,通过连续控制和停止屏障耦合,每个屏障由另一个代理的值函数的不连续函数(即FLOOR或天花板)给出。即使在目前的一维布朗环境中,相关的固定点问题也缺乏所需的连续性或单调性,使得其难以用一般方法解决。然而,下面的定理证明了(9)的解的存在性。此外,第3节和第4节中给出的证明以及第5节中的讨论进一步阐明了解决方案的结构。定理1。对于满足假设1的任何Cf,C>0,任何C.d.f.f,以及任何cl,λ>0,α∈ (0,1),存在'σ>0,因此,对于任何σ≥ σ,存在一个溶液(pa,pb,\'Va,\'Vb)到(9),其中(\'Va,\'Vb)是连续且不断增加的。让我们概述定理1的证明。首先,我们注意到[9]中的RBSDE方法不能用于这种情况。

17
能者818 在职认证  发表于 2022-6-1 05:01:19
事实上,RBSDEs相关系统的反射域是非凸和不连续的(见第5节),迄今为止,此类系统没有可用的存在结果。因此,我们采用directapproach,旨在显示映射(va,vb)7→ (Ja,Jb)7→ (\'Va,\'Vb),其中第一个映射是通过(10)–(11),第二个映射是通过(9),有一个固定点。正如引言中所述,这种方法的主要挑战在于JA和Jb定义中存在“地板”和“天花板”功能,这会导致不连续性。我们提出了以下解决这一困难的一般方法(值得一提的是,定理1的证明实际上表明了马尔可夫完美(或子博弈完美)均衡的存在,也就是说,如果代理在任何中间时间重新评估其目标,所提策略仍将形成均衡。可用于具有类似类型不连续性的许多问题)。这种方法基于这样一种观察,即如果限制在一组“足够嘈杂”的功能中,“地板”和“天花板”操作符可以在适当的意义上连续(参见[7],[17],了解该观察的另一个应用)。注意,bv(X)c是卖方最优停止问题的瞬时奖励过程。用τ表示相应的最佳停车时间。接下来,考虑均匀拓扑中v的一个小扰动v。假设过程v(X)有足够的噪声,即对于任何ε>0的情况,存在一个停止时间τε,因此v(Xτε)≥ v(Xτ)+ε和τε↓ τ为ε↓ 0(例如,布朗运动满足此特性)。然后,bv(Xτε)c≥ bv(Xτ)c保持不变,前提是kv- vk<ε。

18
mingdashike22 在职认证  发表于 2022-6-1 05:01:22
由于运行报酬在时间上是连续的,且τε接近τ,因此我们可以为扰动问题找到一个停止时间,该时间产生的目标值接近于未扰动问题的最优目标值。将这两个问题相互交换,我们得出结论,这两个问题的值函数是密切的,这就产生了所需的映射连续性(va,vb)7→ (Ja,Jb)7→ (\'Va,\'Vb)。然后,将后一个映射限制为一个紧映射,在该紧映射上保证va/b(X)具有足够的噪声,我们可以应用Schauder定理来获得一个固定点。我们强调,这一战略是相当普遍的,可以在目前问题的范围之外应用。然而,为了应用Schauder定理,需要证明所选的压缩是通过映射来保持的:特别是,有足够噪声的va/b(X)被映射为有足够噪声的va/b(X)。后者的预防可能取决于当前问题的结构。在目前的情况下,我们在第3节中利用[6]、[5]的几何方法提供了这样的证明,这种方法可以应用于非常不规则的线性扩散停止问题。它允许我们证明“Va/b(·)”具有远离零的导数,前提是(Va(·)、vb(·))满足该属性,并且基础过程X的波动率σ足够大(命题4)。反过来,后者意味着“Va/b(X)”在上述意义上具有足够的噪声,命题5利用这一结论来证明(Va,vb)7的连续性→ (Ja,Jb)7→ (\'Va,\'Vb)。第4节的大部分内容涉及反馈形式(命题6)中最优连续控制的特征,并显示反馈泛函的正则性。通常,此类特征通过PDE或BSDE方法获得,但后者不能应用于当前情况(即。

19
kedemingshi 在职认证  发表于 2022-6-1 05:01:26
由于停止奖励过程的不规则性,相关方程的适定性未知)。第1项的证明通过结合命题6和定理2.3 agent的最优停止问题得出结论。在本节中,我们研究了单个agent的值函数的性质,前提是两个agent的连续控制以及另一个agent的值函数是固定的。换句话说,我们考虑单个最优停止问题的值函数。我们首先建立了它的基本相对有界性和拟周期性。然后,我们回顾了与线性扩散相关的二阶常微分方程的分析机制,它与[6]、[5]的最优停止的几何方法一起,允许我们建立一个充分强单调的代理最优停止问题的值函数。最后,已建立的单调性、相对有界性和准周期性,允许我们证明值函数相对于其他代理的值函数的连续性(对于固定连续控制),这是本节的主要结果,如命题5.3.1“初步构造”中所述,鉴于假设1和(Aa,Ab)的定义,假设pa∈ aa和pb∈ Absatisfykpa(x)- xk公司∞≤ Cpb(x)- x个∞≤ C、 (12)如命题4所示,σ必须足够大,以确保w(σ)<1,其中w在命题2中定义。某些固定常数C>0(仅取决于(cl,λ,F)),其中k·k∞表示L∞norm(即代理的最大目标值不会因此类限制而改变)。此外,对于任何pa∈ aa和pb∈ Ab,我们有:c(pa(x),pb(x),x)≥ 氯,x个∈ R、 (13)根据c的定义,由于λ在本文中是固定的,我们得到了c(pa(x),pb(x),x)≤ cu=2λ>0。我们经常使用的另一个属性如下。定义1。

20
可人4 在职认证  发表于 2022-6-1 05:01:29
可测函数f:R→ R为“C-接近x”,ifkf(x)- xk公司∞≤ Cx个∈ R、 常数C出现在(12)中。利用上述性质,我们定义了容许障碍的概念:即函数v,因此相关最优停止问题中的报酬函数是v定义2的四舍五入。A函数v:R→ 如果R是可测的且C接近x,则R是可容许的障碍。接下来,我们介绍了代理所面临的最优停止问题的值函数:Vax、 pa、pb、v:= supτJax、 τ,pa,pb,v, x个∈ R、 (14)Vbx、 pa、pb、v:= infτJbx、 τ,pa,pb,v, x个∈ R、 (15)对于pa∈ Aa、pb∈ Ab和容许势垒v。很容易看出这些值函数定义良好且不明确。请注意,pa、pb、Va、Vb和x是以刻度为单位测量的,只有相对测量值是可解释的。因此,以下平衡的安萨兹是自然的:(R)Va(x+1)=Va(x)+1,(R)Vb(x+1)=Vb(x)+1,pa(x+1)=pa(x)+1,pb(x+1)=pb(x)+1。(16) 让我们为上述财产引入一个特殊术语。定义3。我们说函数f:R→ R具有“1-移位性质”iff(x+1)=f(x)+1,x个∈ R、 我们还需要一个目标和相关价值函数的版本,在奖励函数中不含浮点数和升幅,并减去x(这对于第4节中的某些近似值尤为重要)。因此,对于任何pa∈ Aa、pb∈ Ab,任意停止时间τ,以及任意容许势垒v,我们引入:Ja(x,τ,pa,pb,v)=ExhZτexp-Ztc(pa(Xs)、pb(Xs)、Xs)dsga(p(Xt)、pb(Xt)、Xt)- c(pa(Xt)、pb(Xt)、Xt)Xtdt+exp-Zτc(pa(Xs),pb(Xs),Xs)ds(v(Xτ)- Xτ)i,(17)Jb(X,τ,pa,pb,v)=ExhZτexp-Ztc(pa(Xs)、pb(Xs)、Xs)dsgb(pa(Xt)、pb(Xt)、Xt)- c(pa(Xt)、pb(Xt)、Xt)Xtdt+exp-Zτc(pa(Xs),pb(Xs),Xs)ds(v(Xτ)- Xτ)i,(18)Va(X,pa,pb,v)=supτJa(X,τ,pa,pb,v),(19)Vb(X,pa,pb,v)=infτJb(X,τ,pa,pb,v)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 11:38