|
IQ(σ)是非空的:Mσ,qi是欧几里德空间(有限集Gr(Γ)上的一个凸紧子集上的线性(因此是连续的)自映射;所以,布劳尔定理意味着不动点的存在。IQ(σ)是凸值的:对于所有α∈ [0,1]和m,m∈ (Gr(Γ)),αMσ,Q[M]+(1)-α) Mσ,Q[M]=Mσ,Q[αM+(1)- α) m]。因此,如果m=mσ,Q[m]和m=mσ,Q[m],那么αm+(1- α) m=mσ,Q[αm+(1)- α) m]。IQ(σ)是上半连续且紧值的:固定任意序列(σn,mn)nin∑×(Gr(Γ))这样limn→∞(σn,mn)=(σ,m)并且∈ 由于Mσn,Q[mn]=mn,| | M- Mσ,Q[M]| |≤ ||M- mn | |+|Mσn,Q[mn- m] | |+|mσn,Q[m]- Mσ,Q[M]| |。RHS中的第一项因假设而消失。第二项满足度| | Mσn,Q[mn- m] ||≤ ||Mσn,Q | |×| | mn- m | |也消失了。对于第三项,注意σ7→ Mσ,Q[M]是线性映射,supσ| | Mσ,Q[M]| |≤maxs | P(s,x)∈Gr(Γ)Q(s|s,x)m(s,x)|<∞. 因此| | Mσn,Q[M]-Mσ,Q[M]| |≤ K×| |σn-σ| |对于某些K<∞ , 所以它也消失了。因此,m=mσ,Q[m];因此,IQ(·)有一个闭合图,所以IQ(σ)是一个闭合集。IQ(σ)的紧致性源于(Gr(Γ))。因此,IQ(·)是上半连续的(见Aliprantisand Border(2006),定理17.11)。引理3的证明依赖于下面的断言。本附录中权利要求A、B和C的证据见在线附录。索赔A.(i)对于任何常规SMDP,都存在θ*∈ Θ和K<∞ 这样的话,对我来说∈ (Gr(Γ)),KQ(m,θ)*) ≤ K.(ii)固定任何θ∈ Θ和一个序列(mn)nin(Gr(Γ))使得所有(s,s,x)的Qθ(s | s,x)>0∈ S×Gr(Γ)使得q(S | S,x)>0和limn→∞mn=m。然后是limn→∞KQ(mn,θ)=KQ(m,θ)。(iii)KQis(联合)下半连续:固定任何(mn)和(θn)n,使之成为limn→∞mn=mand limn→∞θn=θ。然后是lim infn→∞KQ(mn,θn)≥ KQ(m,θ)。引理3的证明。
|