|
定理3.3证明中的一些技术步骤和近似方法可能会隐藏这个结果所基于的思想:如果φ是参与者1的策略,则*) ∈ Φx,通过Ite^o公式(这里只是试探性的)和QVI问题(3.3)中的四个条件,我们得到v(x)“=”Ex-ZτSe-ρs(AV)-ρV(Xs)ds-Xτ1,k<τSe-ρτ1,k五、Xτ1,k-五、X(τ1,k)--Xτ2,k<τSe-ρτ2,k五、Xτ2,k- 五、X(τ2,k)-+ E-ρτSV(XτS){τS<+∞}≥ 前任ZτSe-ρsf(Xs)ds+Xτ1,k<τSe-ρτ1,kφX(τ1,k)-, δ1,k+Xτ2,k<τSe-ρτ2,kψX(τ2,k)-, δ2,k+ E-ρτSh(XτS){τS<+∞}= J(x;k,а)*).当考虑到~n=П时*, 通过定义φ,我们得到了一个等式*, 所以*, φ*) 这是纳什均衡。然而,必须考虑几个近似序列,因为我们不能直接应用It^o公式(Vis不够规则)和期望值(我们正在处理潜在的有限和)。备注3.6。注意,因为∈ C(S)代表我∈ {1,2},集合是开的,函数δ是可测的,可测极大值定理在[1,Thm.18.19]中给出。我们还观察到,对于上述定理中的(候选)平衡策略,引理2.3中的性质暗示了以下内容(符号很重,但理解定理的证明至关重要):(MV- V)Xx;φ*,~ns< 0,(3.8a)(毫伏)- V)Xx;φ,φ*s< 0,(3.8b)δx;φ*,ν1,k=δXx;φ*,φτx;φ*,ν1,k-, (3.8c)δx;φ,φ*2,k=δXx;φ,φ*τx;φ,φ*2,k-, (3.8d)(MV)- V)Xx;φ*,φτx;φ*,ν1,k-= 0,(3.8e)(MV- V)Xx;φ,φ*τx;φ,φ*2,k-= 0,(3.8f)对于每个策略*), (φ*, φ) ∈ Φx,每个s≥ 0和每个τx;φ,φ*i、 k,τx;φ*,νi,k<∞.证据根据定义2.6,我们必须证明vi(x)=Ji(x;~n*, φ*), V(x)≥ J(x;k,а)*), V(x)≥ J(x;ψ)*, 对于每一个我∈ {1,2}和(~n,~n)策略*) ∈ Φx和(φ)*, φ) ∈ Φx.我们展示了Vand J的结果,Vand J的参数是对称的。第一步:V(x)≥ J(x;k,а)*). 让~n成为玩家1的策略,以便*) ∈ Φx。
|