|
十、*tj∈ Atj(ht)-1) 是给定支付函数ptj(ht)的玩家j的最大化点-1,在(-j) (ht)-1) 和动作空间Atj(ht)-1) ,αi=δAti(ht-1) 对于i 6=j和αj=δx*tj;3.u=δpt(ht-1,在(-j) (ht)-1) ,x*tj)。正如第5.4节所讨论的,Φ是非空的、紧值的、上半连续的。当Nt=0时,对于任何ht-1.∈ Ht-1和xt∈ At(ht)-1) ,Pt(ht)-1,xt)=ZAt0(ht-1,xt)Qt+1(ht-1,xt,st)ft0(dst | ht-1,xt)。让coQt+1(ht-1,xt,st)是Qt+1(ht)的凸包-1,xt,st)。因为Qt+1是有界的、非空的和紧值的,所以coQt+1是有界的、非空的、凸的和紧值的。通过引理3(8),coQt+1是上半连续的。注意ft0(·ht-1,xt)是无原子的,Qt+1是非空且紧值的。作者:Lemma5,Pt(ht)-1,xt)=ZAt0(ht-1,xt)coQt+1(ht-1,xt,st)ft0(dst | ht-1,xt)。通过引理7,PTI是有界的、非空的、凸的和紧值的,并且是上半连续的。然后,我们不再依赖命题4,而是使用引理16来得出Φ是有界的、非空的、紧值的、上半连续的结论。2.正向诱导。第一步要简单得多。任何{(hkt)-1,vk)}1≤K≤∞ Gr(Φt(Qt+1))使得-1,vk)收敛到(h)∞T-1,v∞), 选取(αk,uk),使(vk,αk,uk)∈ Φt(hkt)-1) 一个人≤ k<∞. 由于Φt是上半连续且紧值的,因此存在(vk,αk,uk)的子序列,比如说它本身,使得(vk,αk,uk)收敛到(v∞, α∞, u∞) ∈Φt(h)∞T-1) 由于引理2(6)。因此,(α∞, u∞) ∈ ψt(h)∞T-1,v∞), 这意味着ψ也是上半连续且紧值的。通过引理3(3),ψthas中止可测选择ψt。给定Φ(Qt+1)的Borel可测选择Qt,可以让φt(ht-1) =(qt(ht)-1) ,ψt(ht)-1,qt(ht)-1))). 那么φ是Φt的Borel可测量选择。第2步和第3步不变。3.在有限的地平线上。我们不需要考虑任何m≥ T≥ 1.不用引理13,我们可以用引理9(3)来证明引理18。
|