|
(17) (i)那么Jψ,hc可以写成Jψ,H(t,ρt)=infφ∈C1,2t(λ)ZOhmtφ(t,·)dρt,受制于φ(1,·)≥ -ψ和Dtφ+H*xφ,xφ≤ 0。(ii)函数Jψ,Halso满足Jψ,H(t,ρt)=ZOhmtJψ,H(t,Δω·∧t) dρt.证明。(i) 这是定理3.6在设置F=0和N后的直接结果*={ψ}.(ii)确定设定Φ:=φ ∈ C1,2t(λ):φ(1,·)≥ -ψ、 Dtφ+H*xφ,xφ≤ 0.从第(i)部分,我们立即得到jψ,H(t,ρt)≥ZOhmtinfφ∈Φφ(t,ω·∧t) dρt=ZOhmtJψ,H(t,Δω·∧t) dρt.对于其他方向,对于任何P∈ Pt(ρt),让我们分解P相对于mapX·∧t、 因此存在ρt-a.s.唯一映射ω·∧t型→ Pω·∧t型∈ Pt(Δω·∧t) 这样,对于所有 Ohm,P(E)=ZOhmtPω·∧t(E)dρt。回想一下,X是一个具有特征(αP,βP)的(F,P)-半鞅。那么,ρt-a.s.,X是an(F,Pω·∧t) -也具有特征(αP,βP)的半鞅。亨塞普-ψ -ZtH(αPs,βPs)ds=ZOhmtEPω·∧t型-ψ -ZtH(αPs,βPs)dsdρt≤ZOhmtsupP公司∈Pt(Δω)·∧t) EP公司-ψ -ZtH(αPs,βPs)dsdρt=ZOhmtJψ,H(t,Δω·∧t) dρt,因为这适用于任何P∈ Pt(ρt),通过定义Jψ,H,我们得到了所需的结果。备注3.11。命题3.10中使用的论点可以扩展,以获得众所周知的动态规划原理,即Jt=Jψ,H(t,Δω·∧t) 。简要概述任何停止时间τ的参数≥ t、 我们有以下不等式链,Jt≤ 支持Jτ-ZτtH(αP,βP)dt= 支持infφφτ-ZτtH(αP,βP)dt≤ infφφt,其中第一个不等式源自命题3.10(ii)的分解论证,中间等式源自命题3.10(i)的对偶结果,最终性质源自函数It^o公式和PPDE。
|