楼主: nandehutu2022
1245 55

[量化金融] 多边贸易中的便利化和内部化最佳战略 [推广有奖]

41
何人来此 在职认证  发表于 2022-5-6 04:09:29
因为Theo rem 4.1已经表明价值过程是有限的,所以命题6.1中的表达式暗示了最优交易策略的存在。定理6.1(动态规划原理)给出(Q(t-), Iα(t)-) + Ih(t),P(t)-)) =(q,z,p),存在确定性可测函数v,va和vb:[0,T]×D→ R、 安达地图v:Ohm ×[0,T]×D→ R、 这样,由方程(4.1)定义的数值过程V满足V(t)=V(t,q,z,p)=(V(t,q,z,p),如果Ni(t)- Ni(t)-) = 0,i=a和b;vi(t,q,z,p),如果Ni(t)- Ni(t)-) = 1,i=a或b.(6.3)可通过动态规划原理计算值函数v、Va和Vbt、 Q(t)-), Iα(t)-) + Ih(t),P(t)-)= sup(南、美)∈在,1,h∈Ht,SErCfα(S,Q(S)-), P(S)-), u) +ZStr(P(t),h(s)-))ds!+五、S、 γS、 Q(S)-), Iα(S)-) + Ih(S),u, 私人助理(S)-) + [ua],Pb(S)-) - [ub]F(t),(6.4)当Na(t)时- Na(t)-) = 0和Nb(t)- Nb(t)-) = 0,andvit、 Q(t)-), Iα(t)-) + Ih(t),P(t)-)= 男vt、 Q(t)-), Iα(t)-) + Ih(t),P(t)-)(6.5)当Ni(t)- Ni(t)-) = 1,i=a,b。尤其是在终端时间T时,值函数满足终端条件vT、 Q(T)-), Iα(T)-) + Ih(T),P(T)-)= mf(I(T)-), P(T)-)). (6.6)证据。函数v、Va和Vb的存在源于过程(Q、I、P)的马尔可夫结构,以及排列内订单的指数到达时间的无记忆性。在我们的上下文中,动态编程原理的证明是常规的。

42
kedemingshi 在职认证  发表于 2022-5-6 04:09:33
也就是说,塔克∈ 阿坦德h∈ 定义4.1和2.1中定义的HTA,表示sho rt∑=rCfα(S,Q(S-), P(S)-), u) +ZStr(P(t),h(s)-))ds!;∑=rC∞Xn=2fα(Sn,Q(Sn-), P(Sn)-), un)+ZSnSn-1r(P(Sn)-1) ,h(s)-)) ds!+rIF(I(T),P(T));∑=vS、 γS、 Q(S)-), Iα(S)-) + Ih(S),u, 私人助理(S)-) + [ua],Pb(S)-) - [ub].然后,通过推导方程(6)的相同推理和迭代期望定律,我们得到了[ξ(I(T),C(T))|F(T)]- rCC(t)=E∑+E∑| F(S)F(t).(6.7)因为∑=supα∈作为,h∈健康安全环保∑| F(S)(6.8)通过等式(6)和(6.1),我们知道∑| F(S)≤ Σ.接管最高法院(S,u)∈ 在不平等的两个方面∑+E∑| F(S)F(t)≤ EΣ+ ΣF(t)利用方程(4.1)和(6.1),我们证明了V(t)小于或等于(6.1)的右边。我们从方程(4.1)和(6.1)中知道v(t)≥ E∑+E∑| F(S)F(t), (6.9)对于任意α∈ 阿坦德h∈ 嗯。表达式(6.1)和(6.1)暗示v(t)≥ EΣ+ ΣF(t),因此V(t)大于或等于(6.1)的右边。质量控制的两边,henceV(t)=sup(S,u)∈在,1,h∈Ht,SErCfα(S,Q(S)-), P(S)-), u) +ZStr(P(t),h(s)-))ds!+五、S、 γS、 Q(S)-), Iα(S)-) + Ih(S),u, 私人助理(S)-) + [ua],Pb(S)-) - [ub]F(t).(6.10)当Na(t)时- Na(t)-) = 0和Nb(t)- Nb(t)-) = 0,乘以(6.1)有v(t)=vt、 Q(t)-), Iα(t)-) + Ih(t),P(t)-),因此(6.1)表示形式(6.1)。当Na(t)- Na(t)-) = 1或Nb(t)- Nb(t)-) = 1 ort=T,交易者必须在时间T“交易”,尽管可能是零份额,因此(6.1)采用形式(6.1)或(6.1)。引理6.1每0≤ t<t+T≤ T,假设交易者没有在时间间隔[T,T+t] 。然后是过程六、t、 Q(t)-), Iα(t)-) + Ih(t),P(t)-)0≤T≤T、 i=0,a,b在时间T中是连续的,这意味着lim | T-t′|→0+六、t、 Q(t)-), Iα(t)-) + Ih(t),P(t)-)- 六、t′,Q(t′)-), Iα(t′)-) + Ih(t′),P(t′)-)= 0.证明。

43
大多数88 在职认证  发表于 2022-5-6 04:09:36
必须证明v的连续性,然后从表达式(6.1)证明Va和VbFollows的连续性。任意取两次t≤ t′∈ [0,T],一种任意的价格转换策略α∈ 阿坦丹任意y隐序策略h∈ 嗯。标志t:=t′-t、 假设Na(t)-Na(t)-) = 0和Nb(t)- Nb(t)-) = 对于任意两组初始值(q,z,p)和(q′,z,p),0.(体积q中的连续性)∈ 结果态过程分别表示为(Q,I,P)和(Q′,I′,P′)。如果贸易商从不交易,那么,以ask为例,有三种可能性是动态的。(1) 在Qa(·)=Qa+σa(Wa(·)之前的价差中出现限价销售订单- Wa(t)或Qa′(·)=Qa′+σa(Wa(·)- Wa(t))达到零,在这种情况下,NEW的要价pa和pa′等于pa- 1和Qa和Qa’都变成了在到达的时候。(2) 在Qa(·)和Qa′(·)达到零之前,限价销售订单不会到达价差。到达时,新as k的价格Pak和Pa\'等于Pa+1,而数量Qa和Qa\'仍然不同质量保证- qa′.(3) 当Qa(·)和Qa′(·)中的一个达到零,而另一个没有达到时,限价销售订单到达价差。在案例(1)和(2)中,交易员库存的差异不超过质量保证- qa′+qb- qb′, 现金金额不超过(`pa+)质量保证- qa′+铅+qb- qb′. (3)类事件在整个时间范围内发生的概率[0,T]收敛为零,如下所示:质量保证- qa′→ 根据假设3.1(2),从引理4.1和引理4.2中的价格、库存和现金量的界限,我们知道v(t,q,z,p)=limq′→qv(t,q′,z,p)。(6.11)(时间t的连续性)取任何初始值(q,z,p)∈ D和任何麻木的T∈[0,T- t] 。让我们看看- t) 表示有效的传输策略,终端时间t- T

44
可人4 在职认证  发表于 2022-5-6 04:09:39
然后是关系v(t+t、 q,z,p)=supα∈At(T)-t) ,h∈HtE[ξ(I(T)]- t) ,C(t)- t) )| F(t)]- rCC(t)!。因为在时间间隔[T]内订单动态的变化- t、 这是命令(t) ,在t时终止的最佳预期奖励- t或在t的差异达到O时(t) ,意思是v(t,q,z,p)=v(t+t、 q,z,p)+O(t) 。(6.12)过程的连续性五、t、 Q(t)-), Iα(t)-) + Ih(t),P(t)-)0≤T≤t可以从恒等式(6.1)和(6.1)以及驱动状态过程的布朗运动和泊松过程的性质得出结论。引理6.2和命题6.1的证明遵循关于如何通过鞅方法刻画最优控制和最优停止时间的常规过程。因为它们很长,这里没有提供证据。感兴趣的研究者可以在Davis(1979)和Snell(1952)中找到最初的想法,并在Li(2011)的第2.2.2节中找到最相似结果的论点。引理6.2价格转换策略α*= (S)*, U*) ∈ At、1和隐藏订单策略*∈ Ht,S*当且仅当以下四个条件均成立时,达到(6.1)中的su前提。(1) {Y(t;h)}0≤T≤这是一部超级电影,每小时∈ Ht,T;(2) {Y(t)∧ s*; H*)}0≤T≤这是一个鞅;(3) 要么五、- 男vs*, Q(S)*-), Iα*(S)*-) + Ih*(S)*), P(S)*-)= 0或S*= T(4) u*= arg maxu∈美国*,P(t))钢筋混凝土fα(S)*, Q(S)*-), P(t),u*) +RS*tr(P(t),h*(s)-))ds+ 五、s*, γ(S)*, Q(S)*-), Iα*(S)*-) + Ih*(S)*), U*), Pa(t)+[ua*], 铅(t)- [ub*].命题6.1存在最优切换控制α*= {S*n、 ua*n、 ub*n) }∞n=1∈ a和最优隐序策略h*= (哈*, 血红蛋白*) ∈ H,定义如下。让我们*= ua*= ub*= 0

45
kedemingshi 在职认证  发表于 2022-5-6 04:09:43
当n=1,2时,最佳交易时间S*NCA可以表达为*n=infnS*N-1<t≤ T五、- 男vt、 Q(t)-), Iα*(t)-) + Ih*(t) ,P(t)-)= 0o∧ Tn,如果S*N-1<T;T+1,如果S*N-1=T。如果S*n=T+1,则ua*n=ub*n=0;奥特·赫维苏*n=arg最大值∈美国*n、 P(S)*N-1))rCfα(S)*n、 Q(S)*N-), P(S)*N-1) ,u)+vs*n、 γ(S)*n、 Q(S)*N-), Iα*(S)*N-) + Ih*(S)*n) 宾夕法尼亚州*N-1) +[ua],Pb(S)*N-1) - [ub].表示asrt、 Q(t),Iα*(t) +Ih*(t)-), P(t),h(t):=五、t、 Q(t),Iα*(t) +Ih*(t)-) + a、 P(t)- 五、t、 Q(t),Iα*(t) +Ih*(t)-), P(t)· ha(t)λa私人助理(t)- 铅(t)+五、t、 Q(t),Iα*(t) +Ih*(t)-) - b、 P(t)- 五、t、 Q(t),Iα*(t) +Ih*(t)-), P(t)· hb(t)λb私人助理(t)- 铅(t),为了0≤ T≤ T,最优隐序策略h*可以用灰烬来表达*(t) =arg maxh(t)∈{0,1}nr(P(t),h(t))+rt、 Q(t),Iα*(t) +Ih*(t)-), P(t),h(t)o、 6.2数值算法本小节将给出数值算法,用于计算离散版最优价格转换问题的价值函数和最优交易策略。1.我们将在串行计算机和aGPU集群上详细说明该算法的不同复杂性。时间和状态过程在网格T×X上离散,其中T作为时间T的网格∈ [0,T]定义为sT={0=T,T,T,···,tK=T}={0,t、 二,t、 ···,Kt=t}和X作为状态过程(Q,I,P)的网格是D中的有界集,其中| X |<∞元素。当网格越来越大时,limitlimK→∞, |X|→∞假设T×Xis是[0,T]×D中的一个稠密集。该算法分为以下三个步骤。其输出将是价值函数和最佳交易策略(\'v(tk,x),\'u*0(tk,x),\'h*(tk,x)他没有在(tk)内收到限价单-1,tk]和(\'vi(tk,x),\'u*i(tk,x))当限价卖出(买入)指令在(tk)内到达时-1,tk],代表所有人(tk,x)∈ T×X。伪代码见表6.1。第一步。

46
kedemingshi 在职认证  发表于 2022-5-6 04:09:47
(在终端时间)在tK=T时,终端条件为‘v(T,x)=mf(z,p)。步骤1.1计算每个交易策略在终端时间的交易报酬u∈ U(T,p)为v(T,x;U)=v(T,x;U)=vi(T,x;U)=fα(T,q,p,U)+f(z+gα(T,q,U),p)。步骤1.2终端时间交易的最大回报为‘v(T,x)=’v(T,x)=’vi(T,x)=最大{v(T,x;u)| u∈ U(T,p)}。最佳交易策略是“u”*(T,x)={u∈ U(T,p)|使得v(T,x;U)=v(T,x)}。第二步。(用初始值sxtk,x(tk;u)模拟受控状态过程):=(Qtk,x(tk;u),Itk,x(tk;u),Ptk,x(tk;u))=γ(tk,q,z,p,u),pa+[ua],pb- [ub],根据以下步骤模拟状态过程xTk,x(tk+1;u,h)=(Qtk,x(tk+1;u),Itk,x(tk+1;u,h),Ptk,x(tk+1;u))(6.13)Qitk,x(tk+1;u)=Qitk,x(tk;u)+σi×(均值为零且方差为零的正态r.v.)t) );Qitk,x(tk+1;u)=Qitk,x(tk+1;u)1{Qitk,x(tk+1;u)>0}+i{Qitk,x(tk+1;u)≤0};Itk,x(tk+1;u,h)=Itk,x(tk;u)+aha×(a泊松r.v.,强度λa(pa- pb)(t)- bhb×(a泊松r.v.,强度λb(pa- pb)t) );Patk,x(tk+1;u)=pa+[ua]+1{Qitk,x(tk+1;u)≤0};Pbtk,x(tk+1;u)=pb- [ub]- 1{Qitk,x(tk+1;u)≤0}.(6.14)为了使状态过程保留在网格X内,每次模拟的截断值“Xtk,X(tk+1)”由“Xtk,X(tk+1;u,h):=arg min获得|Xtk,x(tk+1;u,h)- y|Y∈ 十、. (6.15)(可以直接模拟截断值。)根据方程式(6.2)、(6.2)和(6.2)运行M次模拟,以获得“Xtk,x(tk+1;u,h)”。M个模拟值表示为\'Xmtk,x(tk+1;u,h)毫米=1。对于i=a,b,模拟MPoisson随机变量尼姆Mm=1,强度θi(pa- pb)t表示限价单是否在时间间隔内到达价差内(tk,tk+1)。第三步。

47
nandehutu2022 在职认证  发表于 2022-5-6 04:09:50
(价值函数和最优交易策略)这一步根据动态规划原理“v(tk,x)=maxu”执行优化程序∈U(tk,p),h∈{0,1}pa+pbhbλb(pa- pb)-pa+pbhaλa(pa- pb)t+fα(tk,q,p,u)+Ev(tk,Xtk,x(tk+1;u,h)).(6.16)步骤3.1(近似预期)条件预期v(tk,\'Xtk,x,(tk+1))在(6.2)中,通过计算^v(tk,x;u,h)来近似表示:=MMXm=1{Nam=0,Nbm=0}vtk,Xmtk,x(tk+1;u,h)+Xi=a,b{Nim=0}vitk,Xmtk,x(tk+1;u,h).步骤3.2(价差内没有到达时的价值函数和交易策略)这是指在整个时间间隔(tk)价差内没有限额订单到达的情况-1,tk],意思是Ni(tk)- 镍(tk)-1) =0,对于i=a和b。使用代理交易策略u获得的回报∈ U(tk,p)和h∈ {0,1}是v(tk,x;u,h)=pa+pbhbλb(pa- pb)-pa+pbhaλa(pa- pb)t+fα(tk,q,p,u)+^v(tk,x;u,h)。(6.17)交易的最佳值为‘(tk,x)=最大值v(tk,x;u,h)|u∈ U(tk,p)和h∈ {0, 1}. (6.18)最佳交易策略为(`u0)*(tk,x),\'h*(tk,x))=U∈ U(tk,p)和h∈ {0, 1}使得v(tk,x;u,h)=v(tk,x).(6.19)步骤3.3(价差内到达时的价值函数和交易策略)这是指限价指令在时间间隔(tk)内的某个点到达价差内的情况-1,tk],意思是Ni(tk)- 镍(tk)-1) =1,表示i=a或b。使用一般交易策略u的回报∈ U(tk,p)是vi(tk,x;U)=fα(tk,q,p,U)+v(tk,x;U)(6.20)交易的最佳值是vi(tk,x)=max\'vi(tk,x;u)|u∈ U(tk,p). (6.21)最佳交易策略是“ui”*(tk,x)=U∈ U(tk,p)|使得`vi(tk,x;U)=`vi(tk,x). (6.22)我们想区分在CPU和GPU上的反向感应算法的计算复杂性。

48
能者818 在职认证  发表于 2022-5-6 04:09:53
下面的推论是通过价格转换问题的动态规划离散化得出的结论,这是一种脉冲控制和最优控制相结合的类型。感兴趣的读者可以验证其他方法(PDE或反向SDE,如果适用)和其他控制类型的结果是否相同。推论6.1设| T |,|X |和|U |分别为离散化时间网格、空间网格和容许控制集的网格大小,M为估计条件期望的模拟路径数。采用串行计算,算法的时间复杂度为|T |×| X |×| U | M。采用并行计算,尽可能地将复杂度转换为空间复杂度,算法的空间复杂度为| X | U | M,时间复杂度最多可降低到|T |×| U |。证据表6.1列出了alg算法的伪代码、每一步的计算复杂度以及它是否可并行。状态空间X中每个节点的计算都是可并行的,因为它使用以前计算的时间步的结果,而不在同一时间步使用任何其他节点。数字| U |是在所有可容许的控制中获得最大预期回报的复杂性,不能在并行l中进行。例如,要获得数字{a,a,····,aN}中的最大值,可以归纳地计算b:=a和bn:=max{bn-1,an},对于n=2,···,n。然后bN=max{a,a,···,aN}。

49
大多数88 在职认证  发表于 2022-5-6 04:09:56
备注6.1推论6.1中有两个重要的观察结果。(1) 由于状态空间中每个时间步的所有节点都可以并行计算,因此中高维随机控制问题不再是数值禁止的问题。(2) GPU集群上的最小时间复杂度为|T |×|U |,即时间步长的数量乘以允许的控制集的大小。可容许的混合策略集是立方体[0,\'\'pa]×0,pb, 虽然允许的价格转换策略集仅为该立方体内的整数点,因此价格转换问题的实现非常简单。6.3实施本小节在一个更简单的二项式模型中实施算法,以达到作者个人电脑的最佳性能。数值结果的一个有趣应用是计算“公平”内部化溢价*.从TkT到tk+1,模型中的随机性由六个二元变量捕捉。除非另有说明,否则假定独立。其他功能保持不变,上一小节的修改如下。(1) 非交易者的市场参与者引起的成交量变化是一个随机变量R(Qi)∈ {-1,1}概率为{0.5,0.5},i=a,b.(2)让随机变量对(R(Na),R(Nb))∈ {(0,0),(1,0),(0,1)}表示当价差大于一个刻度时,限价单和买入单是否以低于标价一个刻度和高于标价一个刻度的价格到达(值一)或不到达(值零)。这三种情况的概率为{1-pN,pN/2,pN/2},其中pN=0.3·min{spread-1, 1}.(3) 让这对随机变量(R(Ha),R(Hb))∈ {(0,0),(1,0),(0,1)}表示是否存在以中间价格消耗交易的流动性事件(值1)或(值0)。

50
能者818 在职认证  发表于 2022-5-6 04:10:00
这三种情况的概率分别为{0.5,0.25,0.25}。(4) 此外,内部化在这里只意味着填充a(b) 当tk价格Pa(tk)(Pb(tk))时,当tk+1限价销售(购买)订单达到更好的价格Pa(tk+1)=Pa(tk)时- 1(Pb(tk+1)=Pb(tk)+1),由R(Na)=1(R(Nb)=1)表示。我们使用a=b=5,pb=12,pa=18。时间网格是{t,t,··,tK}={1,2,··,10}。在终端时间tK=10时,交易员的库存价值为Pb(10)- 如果为正,每股2英镑;如果为负,每股Pa(10)+2英镑。因为国家空间是有限的,所以它必须以某种方式在边界上进行挖掘。电脑能接受的最大网格就是电脑Qa,Qb,I,Pa,Pb∈ X={0,1,9,10}{-20, -19, · · · , 19, 20}×{12, 13, · · · , 1 7, 18}.网格包含104181个容许点,其中Pa>Pb。图6.1(常规交易者)、图6.2(系统内部化者)和图6.3(系统内部化者)说明了交易者的最佳交易策略如何与模拟的价格路径相互作用。初始时间为t=1,终止时间为t=10。初始值为qa(1)=Qb(1)=5,Pa(1)=16,Pb(1)=15,I(1)=0。交易员在所有三个图表中的行为都显示出卖空和压低价格的企图。他确实使用了不同订单类型的组合——主动订单、隐藏订单和内部订单。然而,由于存货的截断,计算利润的信息量不大。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 21:50