|
在本文中,我们假设σ的以下隐式条件,见下文(2.4),m6=. (2.3)满足该条件,例如,如果x 7-→ σt(x,b)对于某些常数控制b是连续的∈ B、 西。g、 卡拉扎斯和什里夫[23]。请注意,我们不会对弱唯一性适用的控件重新严格控制。此外,根据byGirsanov定理,与(α,β)和(α′,β)有关的(2.1)的两个弱解是等价的。然而,不同的扩散系数会导致相应随机微分方程的相互奇异弱解。接下来我们介绍以下集合:P(ν):=P∈ 问题(Ohm), (P,ν)∈ M, P:=Sν∈UP(ν),U(P):=ν ∈ U、 (P,ν)∈ M, U:=SP∈问题(Ohm)U(P)。由于λ是有界的,因此根据Girsanov定理,任何控制模型M=(P,α,β)∈ 对于无漂移的SDEXt=X+Ztσr(X,β)dWt,t∈ [0,T],带dP′dPFT=e-RTλr(X,αr)dr-RT |λr(X,αr)| dr.(2.4)相反,对于(2.4)的任何弱解(P′,β),F-可选进程β在B中取值,任意有界F-对于A中的值,我们直接从上一个构造中检查(P,α,β)是(2.1)的弱解。布朗运动定义在一个可能扩大的空间上,如果bσ不是可逆的P-a、 我们参考了Possamai、Tan和Zhou[30]的精确陈述。2.3代理问题我们接下来介绍成本函数C:R+×Ohm ×A×B-→ R+,可测量,带c(·,u)F- 可供所有u∈ A×B,我们假设在整个sup(P,ν)∈MEP“ZTct(X,νt)pdt#<∞, 对于一些p>1的人来说。(2.5)Let(P,ν)∈ 我很确定。标准过程X称为输出过程,控制ν称为输出过程或动作。代理负责通过在状态方程(2.1)中选择输出过程ν来控制输出过程的(分布),同时受制于r ate c(X,ν)的输出成本。
|