|
设定值“x:=β”*(c) 在(2.6)中,直接计算得出φλ(\'x)φλ(\'x)=Gx(\'x;c)G(\'x;c)=k(c)\'xk(c)+μθΦ(c)=x- x(c)使c7→Gx(\'x;c)G(\'x;c)在严格地降低。从C7开始→ x(c)是连续的,总是可以将c>c充分地靠近c,使得`x<x(c)<x(c)(因此G(`x;c)<0)和一个findsgx(`x;c)G(`x;c)<φλ(`x)φλ(`x)x)(c-11),因此H(`x;c)>0。因此β*(c) <β*(c) 自x 7以来→ H(x;c)随着x<x(c)而增加。然后是C7→ β*(c) 是一个严格递减的映射。非凸奇异随机控制21我们验证了β的最优性*在下一个定理中,注意到停止时间σ对于(C-1)是最优的当且仅当它对于(2.1)是最优的。定理C.4。边界β*从σ的意义上讲,命题C.3对(C-1)是最优的*of(2.7)是一个最佳停止时间和uβ*≡ u、 证据。候选值函数uβ*(参见(2.5))是这样的,uβ*(·;c)∈ C(R)是命题的。它是凸的。因此它也是非负的,因为uβ*x(β*(c) );c) =uβ*(β*(c) );c) =0乘以(2.5)和(2.6)。很容易检查到(LX- λ) uβ*(x;c)=(θu)- k(c)x,x>β*(c) ,0,x≤ β*(c) 。(C-12)我们声称(稍后我们将证明)β*(c) <θuk(c)=:^x(c)(c-13)因此(LX)- λ) uβ*(x;c)≤ θu - k(c)x代表所有x∈ R.固定(x,c)∈ R×[0,1]。现在取R>0,这样β*(c)∈ (-R、 定义τR:=inf{t≥0:Xxt/∈ (-R、 R)}。利用uβ的凸性*(·,c)、It^o-Tanaka公式(例如,见[27],第3章,第3.6 D节)和我们所拥有的平滑函数原理-λ(τR)∧τ)uβ*(XxτR)∧τ、 c)我≤ uβ*(x,c)+EZτR∧τe-λsθu - k(c)Xxsds, (C-14)对于任意P-a.s.有限停止时间τ≥ 0.现在τR∧ τ ↑ τas R↑ ∞ (C-14)右边期望值内的积分是一致可积的。
|