|
如果(联合国)≥1是Z×M和(zn,mn)n上的有界函数序列≥1是以Z×M为单位收敛到(Z)的序列o, Mo), thenlim infn→ ∞(h,h)→ (0,0)Kh,hun(zn,mn)≥ 库o(z)o, Mo) , 你在哪里o:= 林恩芬→ ∞(z,m)→ ·un(z,m)和Lim supn→ ∞(h,h)→ (0,0)Kh,hun(zn,mn)≤ 库o(z)o, Mo) , 你在哪里o:= 林尚→ ∞(z,m)→ ·un(z,m)。证据我们首先重写kh,hun(zn,mn)=supa∈AZun,h(z,m)dk(z,m | zn,mn,a)(3.11),其中un,h(z,m):=[un]h(max(tn+h,t),x,m)。让我们联合起来o,Ho是infn的下半连续斜坡≥No,H≤Ho从(3.11)开始,我们得到,n≥ Noh≤ Ho,Kun,h(锌,锰)≥ 坤o,Ho(zn,mn),通过(3.6),达到极限inf as(n,h)→ (+∞, 0)导程到IM inf(n,h)→(+∞,0)Kun,h(锌,锰)≥ 坤o,Ho(z)o, Mo).此外,联合国o,Ho↑ Uo切中要害。然后通过单调收敛得到所需的结果。引理3.2。让我们≥1是Z×M和deneu上的下半连续映射序列o:= lim-inf(z,m,n)→(·,∞)un(z,m)在z×m上。假设uo是局部有界的。设φbea连续映射并假设(zo, Mo) 是u的严格极小点o- 在Z×M上。然后,我们可以找到[0,T]×Rd的有界开集B和序列(zk,mk,nk)n≥1.B×M×N使得nk→ ∞, (zk,mk)是unk的最小点- 在B×M和(zk,mk,unk(zk,mk))上→ (左宗棠)o, Uo(佐,莫)。证据由于M被假定为局部紧的,因此必须重复[5,p80,引理证明6.1]中的论点。3.3ε-最优控制的构造仍需解释如何推导最优策略。在时间空间网格的每个点(t,x)和每个先前的m,计算(^`(t,x,m),^b(t,x,m))∈ arg maxZvch(z,m)dk(z,m|(t,x),m,(`,b)),(`,b)∈ A..如果vch(t,x,m)等于上述最大值,则我们播放控件(^`(t,x,m),^b(t,x,m)),否则我们等待下一个时间步。这是通常的哲学:只有当这增加了预期收益时,我们才会对系统采取行动。
|