|
本节的目的是以其等价形式(3.2)建立分布约束最优停止图m的动态规划原理。为此,我们引入了相关的值函数。我们继续在太空中工作(Ohm = C(R+,F,F,W),尽管根据备注3.4,我们注意到这是一个有点任意的选择。具体而言,我们定义v:R+×c(R+)×P→ R byv(t,w,ξ):=supξ·∈MVMt(ξ)EZ∞tc公司重量,w·∧u、 u型dAξu,(3.4)其中,MVMt(ξ)表示ξt=ξa.s.的连续适应MVM集,WT,w·表示SDE dWt的解,ws=dBs,对于∈ [t,∞), 使用initialcondition Wt,ws=wsa。s、 ,对于s∈ [0,t]。我们的主要结果如下:;我们使用约定E[Ξ]=E[Ξ+]- E[Ξ-]具有∞ - ∞ = -∞, 对于任何随机变量:定理3.6(动态规划原理)。对于所有(t,w,ξ)∈ R+×C(R+)×P,以及任何F-停止时间θ,其值为(t,∞), 它认为v(t,w,ξ)=supξ·∈MVMt(ξ)E“Zθtc重量,w·∧u、 u型dAξu+vθ、 重量,w·∧θ、 ξθ#.(3.5)备注3.7。关于dAξ·的积分自然可以理解为Lebesgue–Stieltjes积分。因此,如果ξ∈ P在时间t上有一个原子,它不会贡献给值函数v(t,x,ξ)。同样,在DPP(3.5)的公式中,如果给定的MVMξ·∈ MVM(ξ)在时间θ处有一个原子,原子将通过从t到θ的积分而不是通过t时间θ计算的值函数对目标函数作出贡献。更具体地说,值函数只在时间t之前的w上结束,ξ在(t,∞) 在v(t,w,ξ)=v(t,w)的意义上·∧t、 ξt),式中¢ξt(A)=ξ(A∩ (t,∞)), A.∈ B(R+)。
|