楼主: nandehutu2022
1049 55

[量化金融] 一类随机对策与移动自由边界问题 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-10 17:15:43
请注意,分母始终不小于被积函数的数值,因为被积函数符合约定=0。以N=4,M=6为例,矩阵AAA如图1所示。资源分配策略如图1b所示,可用资源量和类型1和类型2的Yo分别为。当玩家想要控制数量时, 说 ≤ y+y,她将随机使用类型1和类型2中的资源。所以一号玩家将yy+Y来自资源1和yy+Y来自资源二。最后,条件P(ξitξkt6=0)=所有t的0≥ 0和i 6=k排除了N个玩家中任意两个同时跳转的可能性,这有助于在控件涉及跳转时设计可行的控制策略。此条件不是限制,而是应解释为正则化。另见【6、20、30】。当有多个玩家想同时跳转时,可以简单地设计一个适当的顺序,例如通过索引玩家和他们的跳转顺序,以便他们按顺序移动。AAA级=1, 1, 0, 0, 0, 00, 0, 1, 0, 1, 00, 0, 0, 0, 0, 10, 0, 0, 1, 0, 0(a) 关系。(b) 资源分配策略。图1:。相邻矩阵AAA的示例,当N=4且M=6时,参与者和资源之间的关系。博弈公式和博弈准则。让ξξ:=(ξ,···,ξN)作为玩家的控制。设xxx:=(x,···,xN)和yyy:=(y,··,yM)。然后,随机博弈是每个参与者i最小化ji(xxx,yyy;ξξξ):=EZ∞e-αthi(XXXt)dt,(2.8)受(2.3)和(2.7)中的动力学约束,并受(2.6)中的约束。有两种特别有趣的游戏。一种是所有玩家集中资源的游戏,这样Nxi=1ˇξi∞≤ y<∞. (2.9)当N=1时,这是一个单人游戏,对应于【8,26】中充分研究的有限燃料控制问题。

12
nandehutu2022 在职认证  发表于 2022-6-10 17:15:51
我们将此游戏称为池游戏CpCpCp。很明显,就相邻矩阵AAA而言,这对应于M=1,AAA=[1,1,···,1]T∈ RN×1。另一种是一种游戏,玩家在前面分配资源,以便ξi∞≤ yi,(2.10),其中yi是我可以练习的球员控制的总量。这个游戏叫做CdCdCd,M=N,AAA=INININ。最后,我们将具有一般矩阵AAA的游戏称为游戏CCC。我们将在NE准则下分析N人博弈。回想一下N-playergames中NE的定义。6 XIN GUO、WENPIN TANG和RENYUAN Xu定义2.1。容许控制的元组ξξξ*:= (ξ1*, · · · ξN*) 是N人对策(2.8)的NE,如果对于每个ξi∈ u使(ξξ)-我*, ξi)∈ 序号(xxx,yyy),Ji(xxx,yyy;ξξξ*) ≤ 冀xxx,yyy;ξξξ-我*, ξi,式中ξξ-我*= (ξ1*, · · · , ξi-1.*, ξi+1*, · · · , ξN*) 和(ξξ)-我*, ξi)=(ξ1*, · · · , ξi-1.*, ξi,ξi+1*, · · · , ξN*). 给出NEs的控制称为纳什均衡点(NEP)。关联值函数ji(xxx,yyy;ξξξ*) (i=1,2,···,N)被称为玩家i.3的游戏值。NE对策解:验证定理和Skorokhod问题在本节中,我们提出了获得NE解的一般策略。首先,我们试探性地推导出值函数的拟变分不等式(QVIs)(第3.1节),然后通过验证定理(第3.2节)将其用于推导NEP的有效条件。我们强调,第3.1节中的QVIS和第3.2节中的验证定理都适用于(2.3)中给出的一般微分过程。为了明确起见,我们进一步假设h1。bi=0,i=1,2,···,N,σ∑σ=IIIN。此外,我们假设hi(xxx):=hxi-PNj=1xjN, 这样h2。

13
大多数88 在职认证  发表于 2022-6-10 17:15:56
h是对称的,h(0)≥ 0,his在R+和k上不增加≤ h类≤ 对于某些0<K<K,这些附加条件仅用于促进NEP的施工,以及解决第3.3节中提出的相应Skorokhod问题。假设h2下h的一个基本示例是二次函数h(x)=ax+b,其中a∈ [k,k]和b≥ 我们的假设也适用于更一般的函数类。取h为偶数函数,如h=f,其中f为偶数函数,在R+上不增加,在k和k之间有界。有许多这样的函数f。一个特殊的例子是f=A(常数),它将给出h(x)=ax+b(二次函数)。另一个可能的例子是f=b+c exp(-dx),c>0,d>0。在最初的有限燃料问题[8]中,作者处理了二次成本h(x)=x。后来Karatzas[26]注意到,结果可以扩展到满足假设H2.3.1的任何成本函数。拟变分不等式。我们首先根据游戏(2.8)的NE概念(见定义2.1),启发式推导出游戏价值的相关QVIs。关键思想是利用定义2.1中引入的条件最优条件。也就是说,player i用最优解ξi解单agent最优控制问题*当其他药剂应用ξξξ时-我*. 首先,我们定义RN×RM+的以下分区。表示Ai RN×RM+作为ithplayer的行动区域,Wi:=(RN×RM+)\\A作为她的等待区域。让A-i: =∪j6=iAjand W-i: =∩j6=iWj。然后,玩家的操作如下:玩家i控制当且仅当进程(XXXt,YYYYT)进入Ai时。这种划分通常通过拟变分不等式来定义,也是要导出的解的一部分。接下来,为(xxx,yyy)定义中间运算符ΓasΓjvi(xxx,yyy)=MXk=1ajkykPMs=1ajsysvik(xxx,yyyy),(3.1)∈ RN×RM+和i,j=1,2,···,N。

14
何人来此 在职认证  发表于 2022-6-10 17:15:59
此处viyk:=不及物动词yk(i=1,2,···,N,k=1,2,··,M)。假设玩家j采取了可能次优的行动ξj,+>0,然后根据资源分配策略(2.7),对于参与者i,vi(xxx,yyy)≤ vixxx-j、 xj+ξj,+,yyy-aj1yPMk=1ajkyk,···,AJMYPMK=1ajkyk!ξj,+!。(3.2)通过出租ξj+→ 0,我们有0≤ -Γjvi(xxx,yyy)+vixj(xxx,yyy)。(3.3)有限燃料博弈7接下来,我们提供了推导QVIs的启发式方法。允许ξi:=ξi(xxx,yyy)是具有联合状态位置(xxx,yyy)的球员i的控制权。时间(xxx,yyy)∈ W-i、 我们有ξj=0表示j 6=i。因此,玩家i的博弈成为一个经典的控制问题,有三种选择:ξi=0,ξi,+>0,和ξi,-> 0、第一种情况ξi=0意味着,通过简单的随机演算,-αvi+hi(xxx)+Lvi≥ 通过与(3.3)中类似的参数,第二种情况ξi,+>0对应于-Γivi+vixi≥ 0和第三种情况ξi,-> 0对应于-Γivi- vixi公司≥ 因为三个选择中的一个是最优的,所以它们的一个特性就是一个等式。也就是说,对于(xxx,yyy)∈ W-i、 最小值-αvi+hi(xxx)+Lvi,-Γivi+vixi,-Γivi- vixi公司= 0。(3.4)何时(xxx,yyy)∈ Aj,玩家j将控制,控制量为(ξj,+,ξj,-) 6= 0. 因此,vj(xxx,yyy)≤ vjxxx-j、 xj+ξj,+,yyy-aj1yPMk=1ajkyk,···,AJMYPMK=1ajkyk!ξj,+!,(3.5)vj(xxx,yyy)≤ vjxxx-j、 xj公司- ξj,-,yyy年-aj1yPMk=1ajkyk,···,AJMYPMK=1ajkyk!ξj,-!, (3.6)和(3.5)-(3.6)中的一个不等式为等式。这会导致以下情况-Γjvj+VJVXJ,-Γjvj- vjxjo=0。(3.7)对于参与者i 6=j,我们应该有vi(xxx,yyy)=vixxx个-j、 xj+ξj,+,yyy-aj1yPMk=1ajkyk,···,AJMYPMK=1ajkykξj+什么时候ξj,+>0是玩家j的最佳选择,vi(xxx,yyy)=vixxx个-j、 xj公司- ξj,-,yyy年-aj1yPMk=1ajkyk,···,AJMYPMK=1ajkykξj,-什么时候ξj,-> 0是球员j的最佳选择。由于“无同步跳跃”条件(2.6),这一点保持不变。

15
mingdashike22 在职认证  发表于 2022-6-10 17:16:04
直觉上,这意味着当球员j跳起时,球员i没有跳起的动机。因此(-Γjvi+vixj=0,在{(xxx,yyy)上∈ RN×RM+- ΓVvj+vjxj=0},-Γjvi- vixj=0,在{(xxx,yyy)上∈ RN×RM+- Γjvj- vjxj=0}。(3.8)注意:ξi,±→ 0,方程(3.4)、(3.7)和(3.8)描述了Wiand nearboundary中的行为Wi。此外,我们可以证明(3.4)、(3.7)和(3.8)与Ai中的跳跃行为是一致的。要看到这一点,-PMj=1aijyjPMk=1aikykviyj±vixi=0具有线性解决方案vi(xxx,yyy)=a±xi+PMj=1aijyj+b对于一些a,b∈ R、 很容易检查ifPMk=1aikyk≥  > 0,aijyj-aijyjPMk=1aikykPMk=1aikyk- =aijyjPMk=1aikyk,这意味着等待区域外的分配策略(跳跃方向)是线性的。因此,非微小跳跃也满足Ai中的HJB方程(3.4)。一致性属性也适用于(3.8)。总之,我们有以下QVIs:min-αvi+hi(xxx)+Lvi,-Γivi+vixi,-Γivi- vixi公司= 0,打开∩j6=客栈-Γjvj+VJVXJ>0度∩n-Γjvj- vjxj>0oo,(3.9a)- Γjvi+vixj=0,开{-Γjvj+vjxj=0},(3.9b)- Γjvi- vixj=0,打开{-Γjvj- vjxj=0}。(3.9c)上述条件与每个玩家的NE条件最优性一致,并描述了控制玩家与非控制玩家之间的相互作用;这些条件确保所有选手8辛果、汤文彬和徐仁远以最佳方式控制并按顺序推动基本动力,直到到达共同等待区。3.2. 验证定理。接下来,我们提出了一个验证定理,该定理给出了NEP的充分条件。给定函数vi(具有充分的规律性),我们根据vi(i=1,2,····,N)定义动作和等待区域(Aiand Wi),如下所示:Ai=A+i∪ A.-i、 (3.10)式中,A+i:={(xxx,yyy)∈ RN×RM+|- Γivi- vixi=0}和A-i: ={(xxx,yyy)∈ RN×RM+|- Γivi+vixi=0}。此外,Wi=(RN×RM+)\\a和W-i=∩j6=iWj。定理3.1(验证定理)。

16
mingdashike22 在职认证  发表于 2022-6-10 17:16:08
假设H1-H2保持,进一步假设Aj∩ Ai= 对于alli 6=j,其中Ai、WI和W-i根据(3.10)定义。对于每个i=1,···,N,假设it层的策略ξi*∈ u满足以下条件(i)ξξξ*:= (ξ1*, · · · , ξN*) ∈ 序号(xxx,yyy)。(ii)vi(·)满足QVIs(3.9)。(iii)对于任何ξi∈ u使(ξξ)-我*, ξi)∈ 序号(xxx,yyy),P((xxx-我*t、 Xit,YYYYT)∈ W-i) =1表示所有t≥ 0,其中(XXX-我*t、 Xit,yyyy)在(ξξξ)以下-我*, ξi)。(四)六(xxx,yyy)∈ C(W-i) viis凸(xxx,yyy)∈ W-i、 (v)EhRTe-2αtvixj(XXX-我*t、 Xit,YYYYT)dti<∞ 对于所有T>0,其中(XXX-我*t、 Xit,yyyy)在(ξξξ)以下-我*, ξi)∈序号(xxx,yyyy),以便(iii)保持不变。(vi)对于任何(XXX-我*t、 Xit,yyyy)在(ξξξ)下-我*, ξi)∈ 序号(xxx,yyyy),以便(iii)保持,vi(xxx,yyy)满足通用性条件→∞e-αTE不及物动词XXX个-我*t、 Xit,YYYYT= 0.(3.11)(vii)对于j 6=i,t≥ 0和(XXX-我*t、 Xit,yyyy)在(ξξξ)下-我*, ξi),ˋξj*t=Z[0,t]{(XXX-我*s-,Xis公司-,YYYY年-)∈Aj}dˇξj*s、 (3.12)此外,对于(XXX*t、 YYY年*t) ξξ以下*,ˇξi*t=Z[0,t]{(XXX-我*s-,YYY年*s-)∈Ai}dˇξi*s、 (3.13)然后ξξξ*是通过(3.9)的解具有值函数的NEP。即vi(xxx,yyy)≤ Ji(xxx,yyy;(ξξξ)-我*, ξi)),对于所有ξ∈ u使(ξξ)-我*, ξi)∈ SN和vi(xxx,yyy;ξξξ*) = Ji(xxx,yyy;(ξξξ)-我*, ξi*)).证据必须证明,对于所有(ξξξ-我*, ξi)∈ SN(xxx,yyy),对于每个i=1,···,N,Ji(xxx,yyy;ξξξ*) ≤ Ji(xxx,yyy;(ξξξ)-我*, ξi))。有限燃料游戏9召回(2.1)和(2.7)。来自条件(iii),受控(ξξξ-我*, ξi)∈ 序号(xxx,yyy),(xxx-我*t、 Xit,YYYYT)∈ W-ia。s

17
nandehutu2022 在职认证  发表于 2022-6-10 17:16:11
将It^o-Meyer公式【38,定理21】应用于e-αtvi(XXX-我*t、 Xit,yyyy)产量-αTvi(XXX-我*T、 XiT,yyyy)]- vi(xxx,yyy)=EZTe-αtLvi公司- αvidt+EZTe-αtNXj=1vixjdBjt+NXj=1,j6=iEZ[0,T)e-αt(vixjdξj*,+t型- vixjdξj*,-t)-NXj=1,j6=iEZ[0,T)e-αtΓjvi(XXX-我*t型-, 退出-,YYYYT-)dξj*,+t+dξj*,-t型+ EZ[0,T)e-αt(vixidξi,+t- vixidξi,-t)- EZ[0,T)e-αtΓivi(XXX-我*t型-, 退出-,YYYYT-)dξi,+t+dξi,-t型+ EX0≤t<Te-αt不及物动词-NXj=1vixjXjt公司-MXk=1viykYkt公司,其中,IandJare在(3.1)中有定义。在这里vi:=vi(XXX-我*t、 Xit,YYYYT)- 六(XXX)-我*t型-, 退出-,YYYYT-), vixj:=vixj(XXX-我*t型-, 退出-,YYYYT-), viyk:=viyk(XXX-我*t型-, 退出-,YYYYT-), Xj公司*t: =Xj*t型- Xj公司*t型-, Xit:=Xit- 退出-, 和Ykt:=Ykt-Ykt公司-关于上述方程1的RHS≤ i、 j≤ N和1≤ k≤ M根据[3,定理3.2.1],条件(v)意味着it^o积分-αtPNj=1vixjdBjtis是鞅。因此EhRTe-αtPNj=1vixjdBjti=0。(iv)中的凸性条件意味着EP0≤t<Te-αt(不及物动词-PNk6=ivixkXk公司*t型-vixi公司退出-PMj=1viyjYjt)≥接下来是EZ[0,T)e-αt(vixidξi,+t- vixidξi,-t)- EZ[0,T)e-αtΓivi(XXX-我*t型-, 退出-,YYYYT-)dξi,+t+dξi,-t型= EZ[0,T)e-αtvixi(XXX-我*t型-, 退出-,YYYYT-) - Γivi(XXX-我*t型-, 退出-,YYYYT-)dξi,+t+EZ[0,t)e-αt-vixi(XXX-我*t型-, 退出-,YYYYT-) - Γivi(XXX-我*t型-, 退出-,YYYYT-)dξi,-t型≥ 由于条件(ii)和(iv),最后一个不等式成立。更准确地说,vi(xxx)满足了W中的HJB方程(3.9a)-i、 与(iv)一起,我们有以下概率1,vixi(XXX-我*t型-, 退出-,YYYYT-) - Γivi(XXX-我*t型-, 退出-,YYYYT-) ≥ 0,-vixi(XXX-我*t型-, 退出-,YYYYT-) - Γivi(XXX-我*t型-, 退出-,YYYYT-) ≥ 对于每个j 6=i,几乎可以肯定,我们有dξj*t6=0仅当(XXXt,YYYYT)∈ W-我∩ Aj。

18
大多数88 在职认证  发表于 2022-6-10 17:16:15
以及条件(ii)和(3.9b)-(3.9c),EZ[0,T)e-αt(vixj(XXX-我*t型-, 退出-,YYYYT-)dξj*,+t型- vixj(XXX-我*t型-, 退出-,yyyy)dξj*,-t)-EZ[0,T)e-αtΓjvi(XXX-我*t型-, 退出-,YYYYT)dξj*,+t+dξj*,-t型= EZ[0,T)e-αtvixj公司- Γjvi(XXX)-我*t型-, 退出-,yyyy)dξj*,+t型+-vixj公司- Γjvi(XXX)-我*t型-, 退出-,yyyy)dξj*,-t=0。条件(ii)也意味着Lvi- αvi≥ -h、 综合以上所有因素,e-αTEvi(XXX-我*T、 XiT,YYYYT)+EZTe-αthXXX个-我*t、 退出dt公司≥ 六(xxx,yyy)。(3.14)让T→ ∞, 不等式(3.14)和条件(vi)导致理想的不等式。10 XIN GUO、WENPIN TANG和RENYUAN Xu(3.14)中的等式适用于ξi=ξi*由(3.13)和P(XXX)*t、 YYY年*t)∈ ∩Ni=1Wi= 所有t均为1≥ 0和容许集合(2.6)中的“无同时跳跃”条件,其中(XXX*t、 YYY年*t) 是ξξ下的动力学*. 假设给出了满足验证定理(定理3.1)的博弈值vi(i=1,2,···,N),下一步是构建相应的NE策略。这是通过解决一个Skorokhodproblem,将在下一小节中讨论。3.3. 斯科罗霍德问题。在这里,我们提出了在附加假设H1-H2下构建NE策略的必要工具。由于Kang和Williams[25],分析的关键是在一般域中弱构造反射布朗运动。为了更进一步,我们需要一些词汇表。设G=∩我∈IGibe是Rn+m中的一个非空域,其中I是一个非空的索引集,对于每个I∈ 一、 gi是Rn+m中的一个非空域。为简单起见,我们假设I={1,2,···,I},其中···=I。对于每个I∈ 一、 设nnni:Rn+m→ Rn+mbe单位法向量字段Git指向Gi。表示rrri(·):Rn+m→ Rn+mas反射方向开启Gi。固定bbb∈ Rnandσσ∈ Rn×Nas无反射扩散过程的常数漂移和协方差。

19
何人来此 在职认证  发表于 2022-6-10 17:16:18
设ν表示(G,B(G))上的概率测度,其中B(G)是G上的Borelσ-代数。Skorokhod问题是在G中发现一个反射的扩散过程,使得初始分布遵循ν,扩散参数为(bbb,σσσ),且反射方向为沿面Gi。对于每个垂直方向,rrri(i∈ 一) ,表示rrr+I:=(ri,1,···,ri,n)作为rrrian的前n个分量的向量,表示rrr-i: =(ri,n+1,···,ri,n+m)作为rrri的下m个分量的向量。请注意,R-i、 k=ri,k+nb,按照通常的索引规则(k=1,···,m)。针对随机博弈,以下定义是对[25,定义2.1]的直接修改。定义3.2。与数据(G,bbb,σσσσ,{rrri}Ii=1,ν)相关的约束半鞅反射布朗运动(SRBM)是一个{Ft}适应的n维过程XXX定义在一些过滤概率空间上(Ohm, F、 {Ft},P)这样:(i)P-a.s.,XXXt=WWWt+Pi∈IR[0,t)rrr+i(XXXs,YYYs)dηIs适用于所有t≥ 0,(ii)在P下,wwwt是一个具有漂移向量bbb、协方差矩阵σσ和初始分布ν的n维Ft-Brownian运动,(iii)dYjt=Pi∈IR[0,t)rrr-i、 j(XXXt,YYYYT)dηItan和Yjt≥ 0表示j=1,2,···,m,(iv)表示每个i∈ 一、 ηiis一个一维过程,使得P-a.s.,(a)ηiis连续且不递减,ηI=0,(b)ηit=R(0,t){(XXXs,YYYs)∈Gi公司∩G} dηIs适用于所有t≥ 0,(v)P-a.s.,(XXXt,YYYYT)具有连续路径和(XXXt,YYYYT)∈ G代表所有t≥ 0,这里xxx是受控的扩散过程,yyy是资源水平。域G限制XXXT和YYYYT的动态。对于每个(xxx,yyy)∈ Rn+m,设I(xxx,yyy)={I∈ 一:(xxx,yyy)∈ Gi}。让U(S) 表示闭集{(xxx,yyy)∈ Rn+m:距离((xxx,yyy),S)≤ } 对于任何 > 0和S Rn+m.如果S=, 设置U(S) = 对于任何 > 我们列出了以下关于域G和反射方向{rrri,i的假设∈ 一} :A1。

20
何人来此 在职认证  发表于 2022-6-10 17:16:21
G是Rn+msuch thatG=∩我∈IGi,(3.15)其中每个i∈ 一、 gi是Rn+m中的非空域,Gi6=Rm+nand边界Giis C.A2。对于每个 ∈ (0,1)存在R() > 0,这样对于每个i∈ 一、 (xxx,yyy)∈ Gi公司∩ G和(xxx,yyy)∈G满足k(xxx,yyy)- (xxx,yyy)k<R(), 我们有nnni(xxx,yyy),(xxx,yyy)- (xxx,yyy)≥ -k(xxx,yyy)- (xxx,yyy)k.有限燃料游戏11A3。函数D:[0,∞) → [0, ∞] D(0)=0和D() = supI公司∈一、 I6=sup{dist((xxx,yyy),∩我∈我(Gi公司∩ G) ):(xxx,yyy)∈ ∩我∈国际单位(Gi公司∩ G) },用于 > 0满意() → 0作为 → 0.A4。存在一个常数L>0,因此对于每个i∈ 一、 rrri(·)是一个从Rn+minto Rn+Mw的统一Lipschitz连续函数,其中Lipschitz常数为L,krrri(xxx,yyyy)k=1(xxx,yyy)∈ Rn+m.A5。有一个常数a∈ (0,1),向量值函数ccc(·)=(c(·),··,cI(·))和ddd(·)=(d(·),··,dI(·))来自G转化为RI+,以便每个(xxx,yyyy)∈ G、 (i)Pi∈I(xxx,yyy)ci(xxx,yyy)=1,貂∈I(xxx,yyy)DPi∈I(xxx,yyy)ci(xxx,yyy)nnni(xxx,yyy),rrrk(xxx,yyy)E≥ a、 (ii)Pi∈I(xxx,yyy)di(xxx,yyy)=1,貂∈I(xxx,yyy)DPi∈I(xxx,yyy)di(xxx,yyy)rrri(xxx,yyy),nnnk(xxx,yyy)E≥ a、 定理3.3。假设A1-A5,存在与数据相关的受限SRBM(G,bbb,σ∑∑,{rrri,i∈ 一} ,ν)。定理3.3的证明很容易改编自【25,定理5.1】,其中我们构造了一个受约束SRBM的近似序列(随机游动),并使用不变性原理建立弱收敛。4、博弈CPCPP的纳什均衡本节分析了博弈CPCPP的NE。第4.1节推导了HJB方程的解。第4.2节从HJB解决方案构建受控流程。第4.3节推导了游戏CPCP的NE。回想一下,在游戏CPCP中,AAA=[1,1,···,1]T∈ RN×1,唯一资源y=y-NXi=1ˇξItan和Y0-= y、 (4.1)4.1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:08