|
引理2基本上表明,解序列{GTt}| Tt=0和{GTt}| Tt=0是TIME-齐次的,即这两个序列的值不依赖于精确的时间t,而是依赖于(20)和(21)中的总递归数。设K:={K∈Rn |香港≤d} 。现在我们给出了问题(P∞LQ)。定理3。对于问题(AT),如果存在一些M>0,使得任何T的^GT<M和'GT<M,则以下方程组包含一对解,^G*> 0和'G*> 0,^G*:= 水貂∈K^g(K,^g*,\'\'G*), (28)克*:= 水貂∈K'g(K,^g*,\'\'G*), (29)式中^g(K,y,z):Rm×R+×R+→ R+和'g(K,y,z):Rm×R+×R+→ R+定义为^g(K,y,z)=EhK′CK+ (A+BK)×y1{A+BK≥0}+z1{A+BK<0}i、 (30)’g(K,y,z)=Eh-K′C-K+ (A)- 黑色)×y1{A-黑色≤0}+z1{在-BtK>0}i、 (31)2018年11月7日《乳胶类薄膜绘图杂志》,第XX卷,第X期,2015年8月16日和政策*t=^K*xt{xt≥0}+(R)K*xt{xt<0},(32)t=0,····,∞, 解决问题(P∞LQ),其中^K*= arg水貂∈K^g(K,^g*,\'\'G*), (33)千*= arg水貂∈K'g(K,^g*,\'\'G*). (34)此外,在最优控制u*t闭环系统,xt+1=xtA+B(^K*{xt≥0}+(R)K*{xt<0}), 是L-渐近稳定的,即limt→∞E[(x*t) ]=0。证明:我们首先证明,当t增加时,问题的最优值(AT)是不变的。假设最优控制策略{ut}| Tt=0解决了问题em(AT+1)。很明显,v(AT+1)=ETXt=0utxt′Cutxt≥ ET-1Xt=0utxt′Cutxt≥ v(AT)。(35)同时应用(35)和(27)会产生^GT+1≥^GTand^GT+1≥(R)GT。因此,^gt和'gt是关于T的非减量序列。如果存在M,使得任何T的^GT<M和'GT<M,则存在^GT和'GT的两个极限。我们表示^G∞:= 限制→∞^GTand?G∞:= 限制→∞(R)GT。现在,我们分别推导出^GT和^GT+1之间的关系,以及^GT和^GT+1之间的关系。
|