|
因此,对于区间[τ,T]上具有相应财富X的任何可行控制π,我们必须有[U(XT)| Fτ]≤ w(τ,Xτ)。(2.16)结合(2.15)和(2.16)我们有[U(XT)| Ft]=E[E[U(XT)|Fτ]|Ft]≤ E[w(τ,Xτ)| Ft]≤ w(t,x)。因为π是任何可行的控制,我们已经证明了u(t,x)≤ w(t,x)。同样,对于0<x<-vy(t,0)和反馈控制‘π,以及相应的富裕过程‘X和初始条件‘Xt=X,确定停止时间τ*= inf{s≥ t:\'Xs≥ -vy(s,0)}∧ 那么w(s,\'Xs)是[T,τ]上的局部鞅*].如果解的有界性条件满足,那么w(s,`Xs)是[t,τ]上的鞅*],它给出了[w(τ)]*,\'Xτ*)|Ft]=w(t,x)。(2.17)如果我们选择控制π*s=\'πs{t≤s≤τ*}与相应的财富过程X*然后,使用(2.17),我们得到了[U(X*T) |Ft]=w(T,x)无论τ*= T或τ*< T这就给出了所需的结论u(t,x)=w(t,x)。如果满足控制的指数矩条件,则我们可以应用局部化方法和一致可积性来证明w(s,`Xs)是[t,τ]上的鞅*] 因此(t,x)=w(t,x),参见Bian等人(2011,定理4.1)中的详细证明。接下来我们给出一些例子来说明定理2.6和2.8。假设财富过程由dxt=Xt(rdt+bπtdt+σπtdWt)(2.18)给出,X=X,而eb=u-r、 r,u,σ为正常数,W为标准布朗运动,π为渐进可测控制过程。这是(2.2)的一个特例,其中K=R和它的正极锥K={0}。例2.9假设U(x)=pxp,其中0<p<1是一个常数。V(y)=-qyqf对于y>0,其中q=pp-1是一个负常数。双HJB方程(2.8)的解由V(t,y)=V(y)exp给出(q(q)- 1)θ- r) (T)- (t),式中θ=b/σ。
|