楼主: nandehutu2022
1052 55

[量化金融] 一类随机对策与移动自由边界问题 [推广有奖]

41
kedemingshi 在职认证  发表于 2022-6-10 17:17:36
考虑到这两个特殊情况,现在回想一下在游戏CCC中,dYjt=-NXi=1aijYjt-PMk=1aikYkt-dˇξItan和Yj0-= yj公司≥ 0。(6.1)HJB方程(HJB)的有限燃料博弈25- C) ,梯度约束比CPCPCPC和CdCdCd这两种特殊情况更为复杂。当Ai∩ Aj=,(HJB-C)最小值(- αvi+h+NXj=1vixjxj,Γivi+vixi,-Γivi- vixi)=0,表示(xxx,yyy)∈ W-我,-Γjvi- vixj=0,表示(xxx,y)∈ A+j,j 6=i,-Γjvi+vixj=0,对于(xxx,y)∈ A.-j、 j 6=i。特别是,如果AAA=[1,1,···,1]T∈ RN×1,然后(HJB- C) 变成(HJB- Cp);如果AAA=伊宁,则为(HJB- Cd)。与第4节类似,定义行动区域Ai∈ RN×RM+和ithplayer的等待区域wia+i:=E+i∩ Qi,A-i: =E-我∩ Qi,Ai=A+i∪ A.-i、 和Wi:=RN×RM+\\Ai,(6.2),其中e+i:=(xxx,yyy)∈ RN×(R*+)M: 进出口银行≥ f-1NMXj=1aijyj, E-一:=(xxx,yyy)∈ RN×(R*+)M: 进出口银行≤ -f-1NMXj=1aijyj,(6.3)对于E+i,1:=(xxx,y)∈ E+i:MXj=1aijyj≥ xi+x, E+i,2:=(xxx,y)∈ E+i:MXj=1aijyj<xi+x, (6.4)E-i、 1:=(xxx,y)∈ E-i: MXj=1aijyj≥ -xi- x个, E-i、 2:=(xxx,y)∈ E-i: MXj=1aijyj<-xi- x个, (6.5)和{Qi}Ni=1是凸分区,因此Qi∩ Qj=(E+i∪ E-(一)∩ (E+j∪ E-j)∩ WNEfor i 6=j。然后我们定义∏(xxx,yyy)=(xxx)-i、 xi++Pk6=ixkN-1) ,yyy年+, if(xxx,yyy)∈ 气∩ E+i,1,(xxx)-i、 xi-PMq=1aiqyq,yyy+, if(xxx,yyy)∈ 气∩ E+i,2,(xxx)-i、 Pk6=ixkN-1+xi-),yyy年-, if(xxx,yyy)∈ 气∩ E-i、 1、,(xxx)-i、 xi+PMq=1aiqyq),yyy-, if(xxx,yyy)∈ 气∩ E-i、 (6.6)其中阈值函数fN(·)在(4.14)-(4.16)中定义,xi+是唯一的正根,因此z-fN(z)=xi- yiwhenxi≥ f-1N(彝语),xi-是唯一的负根,因此z+~fN(z)=▄xi+yiwhen▄xi≤ -f-1N(彝语)。

42
能者818 在职认证  发表于 2022-6-10 17:17:39
此处yyy+∈ RM+,第j个分量为(yyy+)j=yj-aijyjPMq=1aiqyqPMq=1aiqyq- fN(xi+),yyy年+∈ RM+,第j个分量为(yyy+)j=yj- aijyj,yyy-∈ RM+,第k个组件为(yyy-)j=yj-aijyjPMq=1aiqyqPMq=1aiqyq-fN(xi-), yyy年-∈ RM+,第j个组件为(yyy-)j=yj- 哎呀。请注意,∏(·)将(xxx,yyyy)转换为E+i,1的边界,即。,E+i,1:={(xxx,yyy):PMj=1aijyj=f-1Nxi, 0<xi≤ x} 时间(xxx,yyy)∈ 气∩ E+i,1和to{(xxx,yyy):aijyj=0,j=1,2,···,M}当(xxx,yyy)∈ 气∩ E+i,2,沿方向0,···,-1, · · · 0; -ai1yPMj=1aijyj,····,-aiMyMPMj=1aijyj!∈ RN×RM+,第i个分量为-1、表示所有者:=(xxx,yyy)∈ RN×RM+:| exi |<f-1NMXj=1aijyj, 1.≤ 我≤ N∪{(xxx,yyy)∈ RN×RM+:yyy=0},(6.7),并假设分区{Qi}Ni=1满足以下假设:26 XIN GUO、WENPIN TANG和RENYUAN XUH3-C。对于任何(xxx,yyyy)∈ ∪iAi,∏(xxx,yyy)∈ 拥有。条件H3-C表示如果(xxx,yyy)∈ Ai,那么动态将在玩家i控制后的区域wne中。根据第4节和第5节的分析,以及当处于W时,玩家i的控制策略仅依赖于(xxx,PMj=1aijyj)的“猜测”-i、 我们得到的是| exi |<f-1N(PMj=1aijyj),vi(xxx,yyy)=pN(exi)+ANMXj=1aijyjcoshexir2(N- 1) αN!,(6.8)是(HJB-C)的解决方案,其中pN(·)由(4.11)定义,AN(·)由(4.15)定义。下一步是构建与HJB解决方案(6.8)相对应的受控流程(XXX,YYY)。注意,wne是r2n中的一个无界域,有2N个边界。

43
nandehutu2022 在职认证  发表于 2022-6-10 17:17:44
对于i=1,2,···,N,定义2N个面,WNEFi={(xxx,yyy)∈ WNE |(xxx,yyy)∈ E+i},Fi+N={(xxx,yyy)∈ WNE |(xxx,yyy)∈ E-i} 。每个面上的法线方向由nnni=ci给出N- 1, · · · , -1,···,N- 1.(f)-1N)MXj=1aijyjai1,···,(f)-1N)MXj=1aijyj目标,nnnN+i=cN+i-N- 1, · · · , 1, · · · , -N- 1.(f)-1N)MXj=1aijyjai1,···,(f)-1N)MXj=1aijyj目标,ithcomponent为±1,ciand cN+Ith归一化常数,使KNNIK=knnnN+ik=1。表示每个面上的反射方向asrrri=ci0,····,-1, · · · 0; -ai1yPMj=1aijyj,····,-aiMyMPMj=1aijyj!,rrrN+i=cN+i0,···,1,···0;-ai1yPMj=1aijyj,····,-aiMyMPMj=1aijyj!,ITH组件为±1。ciand cN+I对常数进行规格化,使krrrik=krrrN+ik=1。雀巢战略定义如下。案例1:(XXX0)-,YYYY0年-) = (xxx,yyy)∈ 拥有。可以检查(6.7)中定义的wne和{rrri}2Ni=1上述定义是否满足假设A1-A5。因此,使用数据解决斯科罗霍德问题的方法很弱WNE,{rrri}2Ni=1,bbb,σσ,xxx∈ WNE公司. A1-A5的可满足性见附录A。案例2:(XXX0)-,YYYY0年-) = (xxx,yyy)/∈ 拥有。存在i∈ {1,···,N}这样(XXX0-,YYYY0年-) ∈ 人工智能。(1) If(xxx,yyy)∈ 人工智能+∩ E+i,1,然后玩家i将立即从Xi0移动-= xito Xi=Xi++Pk6=ixkN-1在时间0,其中xi+是唯一的正根,因此z- fN(z)=xi- (PMq=1aiqyq)。这将减少yyy0的资源-= yyy到yyy=yyy+,yyy+的第j个分量为(yyy+)j=yj-aijyjPMq=1aiqyqPMq=1aiqyq- fN(xi+)≥ 0、其他玩家的动态保持不变,即Xk=Xk0-= xk对于k 6=i和1≤ k≤ N根据假设h3-C,我们有(XXX,YYY)=(xxx)-i、 xi++Pk6=ixkN-1) ,yyy年+= ∏(XXX0-,YYYY0年-) ∈拥有。

44
能者818 在职认证  发表于 2022-6-10 17:17:47
(2) If(xxx,yyy)∈ A+i∩ E+i,2,然后玩家i将立即从Xi0移动-= 西托Xi=Xi-PMq=1AIQYQ,资源j从YJ0更改为-= yjto Yj=Yj- aijyjat时间0。其他玩家的动态保持不变,即Xk=Xk0-= XK工作6=i和1≤ k≤ N、 在假设H3-C下,我们有(XXX,YYY)=∏(XXX0-,YYYY0年-) ∈ 拥有。(3) 同样,如果(xxx,yyy)∈ A.-我∩E-i、 1,那么玩家i将立即从Xi0移动-= 西托Xi=Xi-+Pk6=ixkN-1时间0,其中xi-是唯一的负根,因此z+~fN(z)=~xi+(PMq=1aiqyq)。这将更改YYY0的资源-= YYYY到YYY=YYY-其中,yyy的第j个分量-is(yyy-)j=yj-aijyjPMq=1aiqyqPMq=1aiqyq-fN(xi-)≥ 其他玩家的动态在时间0时保持不变,即Xk=Xk0-= xk对于k 6=i和1≤ k≤ N、 假设H3-C,有限燃料博弈27我们有(XXX,YYY)=(xxx)-i、 Pk6=ixkN-1+xi-),yyy年-= ∏(XXX0-,YYYY0年-) ∈ 拥有。(4) If(xxx,yyy)∈ A+i∩ E+i,2,然后playeri将立即从Xi0移动-= xito Xi=Xi+PMq=1 IQYQ,资源j从Yj0减少-= yjtoYj=yj- aijyjat时间0。其他玩家的动态在时间0时保持不变,即Xk=Xk0-= xk对于k 6=I和1≤ k≤ N、 假设H3-C,我们得到(XXX,yyyy)=∏(XXX0-,YYYY0年-) ∈ 拥有。具有约束CCC的N人游戏(2.8)的NE说明如下。定理6.1(N人博弈CCC的NE)。假设H1-H2和H3-C。

45
nandehutu2022 在职认证  发表于 2022-6-10 17:17:50
定义ui∈ RN×R+→ R asui(xxx,y)=pN(exi)+AN(y)coshexiq2(N-1) αN如果| | xi |≤ f-1N(y),y=0,uixxx个-i、 xi++Pk6=ixkN-1,fN(xi+)如果▄xi>f-1N(y)和y≥ xi+x,uixxx个-i、 xi- y、 0个如果▄xi>f-1N(y)和y<xi+x,uixxx个-i、 Pk6=ixkN-1+xi-,fN(xi-)如果▄xi<-f-1N(y)和y≥ -xi- x、 用户界面xxx个-i、 xi+y,0如果▄xi<-f-1N(y)和y<-xi- x、 (6.9)和定义六:RN×RM+→ R asvi(xxx,yyy)=用户界面xxx,PMj=1aijyjif(xxx,yyy)∈W-i、 六xxx个-j、 xj++Pk6=jxkN-yyy年1月+if(xxx,yyy)∈ A+j∩ E+j,1对于j 6=i,vixxx个-j、 xj公司- (PMq=1ajqyq),yyy+if(xxx,yyy)∈ A+j∩ E+j,2对于j 6=i,vixxx个-j、 Pk6=jxkN-1+xj-,yyy年-if(xxx,yyy)∈ A.-j∩ E-j、 1对于j 6=i,vi(xxx)-j、 xj+(PMq=1ajqyq),yyy-if(xxx,yyy)∈ A.-j∩ E-j、 2对于j 6=i,(6.10),其中oa和w在(6.2)中给出,E±i,1和E±i,2在(6.4)-(6.5)中给出,fN(·)由(4.14)-(4.16)定义,并且fN(x)=fN(-x) 对于x<0EXIS由(4.2)定义,AN由(4.15)定义(6.9)中的xi+是z的唯一正根-fN(z)=exi-y如果▄xi≥ f-1N(y)和xi-是z+~fN(z)=exi+y(如果▄xi<-f-1N(y)。o(6.10)中的xj+是z的唯一正根- fN(z)=exj-PMk=1ajkykifxj≥ f-1N(PMq=1ajqyq),和XJ-是z+~fN(z)=exj+PMk=1ajkykifxj<-f-1N(PMq=1ajqyq)。o(6.10)中yyy+的第k个分量为(yyy+)k=yk-ajkykPMq=1ajqyqPMq=1ajqyq- fN(xj+), 和yyy的k-thcomponent-is(yyy-)k=yk-ajkykPMq=1ajqyqPMq=1ajqyq-fN(xj-).o (6.10)中yyy+的第k个分量为(yyy+)k=yk- ajkyk和yyy的第k个组件-is(yyy-)k=yk- ajkyk。那么Vi是与NEPξξξ相关的值*= (ξ1*, · · · , ξN*). 也就是说,vi(xxx,yyy)=JiC(xxx,yyy;ξξξ*).

46
能者818 在职认证  发表于 2022-6-10 17:17:53
此外,受控过程(XXX*,YYY年*) ξξ以下*是案例1中描述的Skorokhod问题的解决方案,如果(xxx,yyy)∈ WNE,描述为案例2 if(xxx,yyyy)/∈ 拥有。定理6.1的证明与定理4.3相似,因此省略了。为了证明这种相似性,我们提供了值函数viin W的凸性的证明-我在这里。证据我们以player one为例,说明v(xxx,yyy)=▄v(▄x,PMj=1a1jyj)是凸的-1、其他玩家的价值函数类似。回忆▄xi=xi-PNk6=ixkN-1、同样,我们定义了▄yi=PMk=1aijyj。时间(xxx,yyy)∈W-1,我们有| x |≤ yor  y=0。因此,ev(~x,~y)为正半定义。根据链式法则,对于2≤ k 6=j≤ N28新果、汤文品、任元轩1≤ q 6=p≤ M、 vxx(xxx,yyy)=evxx(x,yy),vxxk(xxx,yyy)=-N-1evxx(yenx,yeny),vxyq(xxx,yyy)=a1qevxy(yenx,yyy),vypyq(xxx,yyy)=a1pqevyy(yenx,yy),vxkxj(xxx,yyy)=(N-1) evxx(▄x,▄y),vxkyq(xxx,yyy)=-N-1a1qevxy(¢x,¢y)表示H(xxx,yyy):=v(xxx,yyy)∈ R(N+M)×(N+M)作为某点(xxx,yyy)的Hessian矩阵∈ W-1、然后,对于任何ddd=(b,···,bN,c,··,cM)∈ RN+M,dddTH(xxx,y)ddd=bevxx-N- 1NXk=2bbkevxx+(N- 1) NXk=2bk+(N- 1) X2个≤j6=k≤Nbjbkevxx+2MXq=1bcq1qevxy-N- 1NXk=2MXq=1bkcqa1qevxy+(MXq=1a1qcq)evyy=b-N- 1NXk=2bk!evxx+2b-N- 1NXk=2bk!MXq=1a1qcq!evxy+MXq=1a1qcq!evyy=eeeT▄H(▄x,y)eee≥ 0,其中eee=b-N-1PNk=2bk,PMq=1a1qcq和▄H(▄x,y)=~v(~x,y)。最后一个不等式成立,因为当x为凸时,v(≈x,y)是凸的≤ y,这是定理4.3(第(iv)步第1步)证明的结果。因此vis凸inW-1.7、比较游戏Cp、CDC和CIn本节将比较游戏CPCP、CDCDCDC和CCC。我们将首先比较它们的游戏价值,并讨论其经济影响。然后,我们将讨论他们在NEP方面的差异。

47
大多数88 在职认证  发表于 2022-6-10 17:17:56
最后,我们在受控秩相关SDE的框架下讨论了它们的前景。为了使游戏具有可比性,让我们假设y=PNj=1yj。让我们也考虑一个特殊的共享游戏CSCSCSW,它可以与CDCDCDC和CpCpCp连接:CSCSC:M=N和aii=1,i=1,2,··,N。7.1. 合并、分割和共享。对于游戏CPCP,将每个玩家i的游戏值和等待区域分别表示为VICPANDWCP。CDCDCDCDD和CSCSC定义了类似的符号。命题7.1(游戏价值比较)。假设H1-H2。对于每个(xxx,yyy)∈ RN×RN+,表示y=PNi=1yi。If(xxx,y)∈ WCpi和(xxx,yyy)∈ WCdi∩ WCsi,然后,viCp(xxx,y)≤ viCs(xxx,y)≤ viCd(xxx,yyy),i=1,2,···,N.证明。通过直接计算进行比较。实际上,回想一下,在CpCpCp的情况下,当(xxx,y)∈ WCpi,viCp(xxx,y)=pN(exi)+AN(y)coshexiq2(N-1) αN, 对于i=1,2,···,N,其中(4.2)中定义了存在,而(4.15)中定义了不存在。同样,在CdCdCd的情况下,当(xxx,yyy)∈ WCdi,viCd(xxx,yyy)=pN(exi)+AN(yi)coshexiq2(N-1) αN, 对于每一个=1,2,···,N。如果是CSCSC,当(xxx,yyy)∈ WCsi,viCs(xxx,yyy)=pN(exi)+ANPNj=1aijyjcosh公司exiq2(N-1) αN,对于每个i=1,2,···,N。通过初等计算,AN(y)<0。因此,当y=PNj=1yj时,(xxx,y)∈ WCpi和(xxx,yyy)∈ WCdi∩ WCsi,viCp(xxx,y)≤ viCs(xxx,y)≤ viCd(xxx,yyy)。第一个不等式成立,因为y=PNi=1yi≥PNi=1aijyjand,当且仅当每个j=1,2,···,N的aij=1时,等式成立。第二个不等式成立,因为对于每个j 6=i,aii=1,且当且仅当aij=0时,等式成立。有限燃料游戏29(a)CpCpCp(b)CdCdCd(c)CCC图3。当N=3时,CpCpCp、CdCdCd、CCC的预计演变边界比较。这一结果具有明确的经济解释。

48
nandehutu2022 在职认证  发表于 2022-6-10 17:18:01
在一个随机博弈中,玩家可以选择共享资源,而不是提前划分资源,共享的成本将低于划分。Poolgyields为每个玩家提供最低的成本。确定预计的公共等待区所有者(yyy):=(xxx,yyy)∈ RN×(R*+)M: | exi |<f-1NMXj=1aijyj对于1≤ 我≤ N∪{yyy=0}。对于任何固定资源级别yyy。那么WNE(yyy)是一个具有2N个边界面的多面体。图3a显示了一个池名CPCP。一个玩家执行控制后,边界的所有面都会移动。图3b对应于一个视频游戏CdCdCd。在玩家i进行控制后,她的脸上的Fi和Fi+n会移动。这里i=1,N=3。对于共享游戏CCC,如图3c所示,在一个玩家练习她的控制后,与她相关的玩家的脸将移动,而其他玩家的脸保持不变。这里i=2和播放器2和3是连接的。7.2. 游戏和受控排名相关SDE的NEs。在前面的章节中,可控动力学是通过反射布朗运动直接构建的。这类SDE也可以在秩相关SDE的框架中进行转换。事实上,N-player作用区域中NE的受控动力学可以写成受控的秩相关SDE:dXit=NXj=1Fi(XXXt,yyyyy)=F(j)(XXXt,yyyy)δjdt+σjdBjt+dξj,+t- dξj,-t型, dYjt=-NXi=1aijYjs-PMk=1aikYks-dˇξ是,带(ξi,+,ξi,-) 控制装置,Fi:RN×RM+→ R一个秩函数,取决于XXX和YYY,F(1)≤ · · · ≤ F(N)(Fi)1的顺序统计量≤我≤N、 和δi∈ R、 σi≥ 0.在游戏CpCpCp中,行动区域中的受控动态通过FiCp(xxx,yyy)=xi满足SDE-Pj6=ixjN-对于每个i=1,···N,δi=0和σi=0;对于每个i=1,···N,ξi,±=0- 1和ξN,±6=0。游戏中的CdCdCd、FiCd(xxx、yyy)=xi-Pj6=ixjN-1.- f-1N(彝语).

49
nandehutu2022 在职认证  发表于 2022-6-10 17:18:04
对于一般游戏CCC,行动区域中的受控过程由等级相关动力学控制,FiC(xxx,yyy)=| xi-Pj6=ixjN-1.- f-1N(PMj=1aijyj)| fNa阈值函数定义在(4.14)-(4.16)中,δi,σi和ξi,±满足与之前相同的条件。注意,没有控制的特殊情况,即Fi(xxx,yyy)=xindξi,±=0,对应于秩依赖des。特别是,δ=1、δ=···δN=0的秩相关SDE称为Atlas模型。据我们所知,30 XIN GUO、WENPIN TANG和RENYUAN Xu之前没有研究过具有额外控制或一般秩函数Fi的秩相关SDE。还有许多方面,包括唯一性和样本路径属性,有待进一步研究,我们将其留给感兴趣的读者。参考文献[1]D.Aldous。”《顺流而下》游戏故事。2002年。可在http://www.stat.berkeley.edu/奥尔德斯/研究/行动/河流。pdf。[2] L.Alvarez和L.Shepp。随机波动种群的最优收获。《数学白化病杂志》,37(2):155–1771998年。[3] 阿诺德。随机微分方程。1974年,纽约。[4] R.Atar和A.Budhiraja。无界域上具有状态约束的奇异控制。《概率年鉴》,34(5):1864-19092006。[5] A.Banner、R.Fernholz和I.Karatzas。Atlas股票市场模型。《应用概率年鉴》,15(4):2296–23302005。[6] M.Basei、H.Cao和X.Guo。具有脉冲控制的非零和随机对策。arXiv预印本arXiv:1901.0808512019。[7] J.Bather和H.Cherno Off。控制太空船的顺序决策(有限燃料)。《应用概率杂志》,4(3):584–6041967。[8] V.Beneˇs、L.Shepp和H.Witsenhausen。一些可解的随机控制问题。《随机:概率与随机过程国际杂志》,4(1):39–831980。[9] A.Budhiraja和K.Ross。

50
nandehutu2022 在职认证  发表于 2022-6-10 17:18:07
具有状态约束的奇异控制问题最优控制的存在性。《应用概率年鉴》,16(4):2235–22552006。[10] M.Chiarola、G.Ferrari和F.Riedel。有限资源下N-企业随机不可逆投资的广义Kuhn-Tucker条件。《暹罗控制与优化杂志》,51(5):3863–38852013。[11] P.-L.Chow、J.-L.Menaldi和M.Robin。具有有限视界的随机线性系统的加性控制。《控制与优化杂志》,23(6):858–8991985。[12] M.Davis和A.Norman。具有交易成本的投资组合选择。运筹学数学,15(4):676–7131990。[13] 德安吉利斯和法拉利。随机非零和对策:奇异控制和最优停止之间的新联系。《应用概率进展》,50(2):347–3722018。[14] J.Dianetti和G.Ferrari。非零和次模单调跟随对策:纳什均衡的存在性和逼近性。《暹罗控制与优化杂志》,58(3):1257–12882020。[15] R.Fernholz。随机投资组合理论,《数学应用》(纽约)第48卷。Springer Verlag,纽约,2002年。随机建模和应用概率。[16] X.Gao、Y.Lu、M.Sharma、M.Squillant和J.Bosman。动态资源分配的有界速度随机控制。arXiv预印本arXiv:1801.012212018。[17] L.Georgiadis、M.Neely和L.Tassiulas。无线网络中的资源分配和跨层控制。《网络基础与趋势》,1(1):1–1442006年。[18] F.Gozzi和F.Russo。通过依赖时间的福岛-狄里克莱分解验证随机最优控制问题的定理。随机过程及其应用,116(11):1530–15622006。[19] X.Guo、P.Kaminsky、P.Tomecek和M.Yuen。存在成本和价格风险的最优现货市场库存策略。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:21