|
[8]中的定理3.5.2,它表明w确实等于值函数v,且^q是最优控制。最后,一旦确定了最优交易率^q,就可以通过对ξ的优化得到最优产量∈ 终端成本的R(Dt,Dt-^Xt,x,y,dT,ξ),由以下公式给出:^ξT=ηη+β(dT,dT-^Xt,x,y,dT)。A.2定理4.1Hamilton-Jacobi-Bellman(HJB)积分微分方程的证明,该积分微分方程由与随机控制问题相关的动态规划产生,该问题在Y和D的动力学中具有跳跃:~v(λ)t+infq∈RQ~v(λ)x+νq~v(λ)y+u~v(λ)d+σ~v(λ)y+σd~v(λ)d+ρσd~v(λ)Yd+q(y+γq)+ λp+~v(λ)(t,x,y+π+,d+δ++p-~v(λ)(t,x,y+π)-, d+δ-) - ~v(λ)(t,x,y,d)= 0~v(λ)(T,x,y,d)=C(d- x) =r(η,β)(d)- x) 。请注意,对于无跳跃情况,HJB方程中还有一个线性积分微分方程(不依赖于控制),并且argmin在无跳跃情况下为@q(λ)(t,x,y,d)=-2γ~v(λ)x+ν~v(λ)y+y.然后将HJB方程改写为~v(λ)t+u~v(λ)d+σ~v(λ)y+σd~v(λ)d+ρσd~v(λ)YD-4γ~v(λ)x+ν~v(λ)y+y+ λp+~v(λ)(t,x,y+π+,d+δ++p-~v(λ)(t,x,y+π-, d+δ-) - ~v(λ)(t,x,y,d)= 0v(λ)(T,x,y,d)=r(η,β)(d)- x) 。(A.6)我们再次寻找(A.6)的候选解,其形式为w(λ)(t,x,y,d)=Aλ(t)- t) (d)- x) +Bλ(T)- t) y+Fλ(t)- t) (d)- x) y+Gλ(T)- t) (d)- x) +Hλ(T)- t) y+Kλ(t)- t) ,(A.7)对于某些确定性函数Aλ,Bλ,Fλ,Gλ,Hλ和Kλ。
|