|
(1) 设f:R×Rm→ R和g:Rn→ R都是凸的和Lipschitz连续的。定义一个极端风险度量ρ:L(Ohm) → R作为ρ(ξ):=infy∈RmE[f(ξ,y)]。此外,定义(y):=infA∈AEFGXAT, Y.然后呢?:=英法∈Aρ(g(XAT))=infy∈RmV(y)。(2) 无论如何, η>0,定义(x,y):=infz∈Rmf(x,z)+ky- zk2.设^W为独立的n维布朗运动,设^F为联合过程(W,^W)产生的过滤。设^A代表A中所有^F适应过程值的集合。对于每个控制A∈^A,定义^XA,η为扰动SDEd^XA的唯一强解,ηt=u^XA,ηt,Atdt+σ^XA,ηt,AtdWt+ηd^Wt.defi neV,η(y):=infA∈^AEhf(g(^XA,ηT),y)i表示为五、,η(y)V的近端超梯度的集合,η在y上,我们得到以下结果:(a)对于任何y∈ 如果我们确定,η(y):=EhDyf(g(^XA,ηT),y)i,然后是DV,η(y)∈ 五、,η(y)。(b) 对任何人来说∈ Rm,V,η(y)和DV,η(y)可以用两个偏微分方程的解来计算。值函数与HJB方程有关,而近似超梯度与HJB方程的形式线性化有关。(3) 让我来?是V和y的最小值吗?,η是V的极小值,η. 然后呢?,η) ≤ V(y?+C( + η) ,其中C>0是一个常数,仅取决于f、g、u和σ的Lipschitz常数。那就是,V(y)?,η) → P线性地, η → 0.条件风险值的最优控制8.总之,该定理为求解ρ(g(XAT))的最优控制提供了一个完全收敛的算法。首先,我们展示了如何将其改写为一个双层最小化问题,其下层是一个标准的最优随机控制问题。
|