|
然后控制(u*(Xs,Zs,~Zs),v*(Xs,Zs,~Zs))是纳什均衡。证明:我们首先注意到,由于哈密顿结构保持不变,遍历游戏者的证明与定理3相同。因此,我们将重点放在折扣上。对于任意容许控制v,则*, v) 生成一个度量单位Pu*,vunder哪个dWu*,vt=dW- R(u)*t、 dt是布朗运动。然后(e)-αtYt)=-E-αt[H(Xt,~Zt,u*电视*t) +ZtR(u)*t、 vt)]dt+~ZtdWu,v*T,因此,整合并接受对Pu的期望*,v、 我们得到了∧Y=Eu*,五、ZTH(Xt,~Zt,u)*电视*(t)-■ZtR(美国)*t、 (vt)- L(Xt,u)*t、 (vt)dt+ E-α标准箱*,五、~YT+ 欧盟*,五、ZTL(Xt,u)*t、 vt)dt.在两边进行lim sup,我们得到Y≤ 欧盟*,五、Z∞L(Xt,u)*t、 vt)dt= J(x,u)*, v) ,v=v的等式成立*.定理9。该系统(18)接受了第8项意义上的马尔可夫解。证据概述:由于严格的证据几乎和第4项的证据相同,我们只概述了细微的差异。我们的第一个目标是使用Picard迭代(7)构造系统(18)的解决方案。对于固定α>0,遍历BSDE的统一估计(8)和(9)与之前一样成立,而对于贴现BSDE,统一估计(8)被| v2,n(x)|代替≤ C/α,|v2,n(x)- v2,n(0)|≤ C(1+kxk),其中常数C>0与n和α无关(详情见[3]中的定理8])。这使得我们只需简单的定义就可以完成定理4的其余部分。我们现在关心的是当我们将贴现率α设为零时会发生什么。其思想是从序列{αn}n中提取一个收敛的子序列∈然后研究极限物体。我们首先展示以下结果:定理10。设yα(x),~yα(x)是马氏解to(18)的y分量,λα是第一个游戏者的遍历值。
|