|
b) 当N=10,=0.05,α=10,γ=-100(实线),当N=10,=0,α=γ=0(虚线)时,系统(23)、(24)、(3)的损耗分布在[0,T]中,T=1。式中(ξ+t)′=dξ+tdt,t≥ 0和?Xt,t≥ 0,定义为(26),(27)减少(2 9)到(25)。最后请注意,选项Zt=Xt,t≥ 0,且β=βt=β(t,Xt)=α\'\'Xt- Xt公司+ γ\'\'Xt- ξt+ (ξt)′,t>0,(32),其中\'Xt,t≥ 0,定义为(20),(21),减少(29)至(19)。然而,如第3节所述,方程式(20),(21)表示“Xt=ξt,t≥ 这意味着in(32)γ乘以0。In(6)和In(25)α和γ是常数。在本节中,参数αa和γ是时间的函数。设B为[0,T]中定义的实平方可积过程集,T>0。面随机过程ζ=ζt,t∈ [0,T]属于B当且仅当EZTζtdt<+∞.给定常数λ>0,t>0,目标轨迹ξt,t∈ [0,T],让我们确定β=βT∈ B作为以下随机最优控制问题的解:minβ∈BUλ(β),(33),其中uλ(β)=EZT公司(Zt- ξt)+λβtdt公司, β=βt,t∈ [0,T],λ>0,(34)受约束:dZt=βdt+σdWt,T∈ [0,T],(35)Z=ξ+。(36)在控制问题(33)、(34)、(35)、(36)中,函数Uλ(β),β=βt,t∈ [0,T],λ>0,是效用函数,β=βT,T∈ [0,T]是控制变量。效用函数Uλ(β),β∈ B、 λ>0,在(34)中定义为两项之和。第一学期,EZT(ZT- ξt)dt, 处罚Zt、t的离开∈ [0,T],从目标轨迹ξT,T∈ [0,T]。第二个,EZTλβtdt, 惩罚控制变量βt,t的“大小”∈ [0,T]。我们使用动态规划原理(见[10])来解决问题(33)、(34)、(35)、(36)。
|