|
此外,假设P( t型∈ T:Gt≥ 0)>0且存在c>1,使得(ctGt)t≥0从上方一致有界。(4.1)则存在平衡。在陈述证据之前,让我们对假设进行评论。备注4.2。(a) 条件(4.1)特别涵盖了具有次指数增长的支付函数的贴现问题。考虑示例2.1的马尔可夫链设置,其中有一个有界且非负的支付函数g(t,x)和一个贴现因子δ∈ (0, 1). 然后设置gt=t的δtg(t,Xt)∈ T(和G∞= 0),我们发现(4.1)满足anyc∈ (1, δ-1).(b) 下面定理4.1的证明有三个步骤。限制停止策略θ的构造及其最优性条件的验证根本不需要(4.1)。后者用于确保θ是可容许的。还有许多其他情况下,可接受性保持不变,包括无折扣,可根据具体情况确定,例如具有有限状态空间和齐次报酬gt=g(Xt)的马尔可夫链的情况。条件(4.1)仅仅是编写简单而公平的一般结果的一种方法。当然,σ=∞ a、 s始终是p(τ)的有效条件 σ) 6=0,对于任何停止时间τ。(c) 类似地,在许多情况下,可以直接从G的附加结构看出Ltθ<∞ a、 s.适用于所有t∈ T、 在这种情况下,G∞I相关。(d) 另一方面,如果没有一些假设,就不能保证存在。例如,如果Te=∞ 域内,但P(σ<∞) = 1(参见下面的示例5.1,p>0),严格增加的奖励G导致不存在,因为停止对于任何代理都是不可取的,但θ除外≡ 不允许使用0。定理4.1的证明。对于t<∞, 设Atbe为生成Ft的原子的(可数)集合。
|