|
(4.60)估算值(4.59)表示g(t,y)- g(t,2y)≤cyor g(t,2y)- g(t,y)≥ -cy.因此,关于(4.60),我们有-8cy≤ ygy(t,y)<0,由此得出关系式(4.34)。4.4验证理论在证明值函数是方程(4.24)-(4.25)的唯一经典解之后,我们可以陈述与(4.11)的经典解有关的验证定理,并给出一种测试给定容许策略是否最优的方法。要查看该定理的标准证明,我们请读者参考[13,Ch.IV,定理3.1]。定理4.12。(验证定理)(a)设h∈ C([0,T]×[S,F])∩ C1,2([0,T)×(S,F);R)是具有边界条件(4.13)-(i)-(ii)-(iii)的(4.11)的经典解。然后,对于任何初始数据(T,z)∈ Cand容许策略π=(π(·),π(·))∈ πad(t,z),我们有h(t,z)≤ J(t,z;π(·),π(·))。(b) 如果存在π*= (π1,*(·), π2,*(·)) ∈ πad(t,z)使得对于任何s≥ t(π1,*s、 π2,*s)∈ arg min{Ah(s,Z*s) +κηs(C- π2,*s) },其中运算符A在(4.12)和Z中定义*sis对应于策略π的(3.2)的解*, 带Z*t=z,然后是π*是最优策略,h等于值函数,h(t,z)=V(t,z)=J(t,z;π1,*(·), π2,*(·)).在任意点(t,z)∈ [0,T)×[S,F],我们建立了闭环方程来证明最优策略的存在唯一性。
|