|
假设u:[b,∞ ) → [0,1],π:[b,∞) → R和Θ:R×[b,∞) → R是满足下列条件的可测函数:(i)u∈ C[b,ws]∩ C[b,ws);(ii)u是λu(w)=infπsupθ的解-2εθ+Lπ,θu(w), W∈ (b,ws);(6.4)(iii)对于w,u(b)=1,u(w)=0≥ ws;(iv)对于每个w,∏(w)达到(ii)中的最大值∈ (b,ws);Θ(π,w)对于每个π都达到(ii)中的上确界∈ R和w∈ (b,ws);(v) π(w)=Θ(π,w)=0如果w/∈ (b,ws);(vi)在(b,ws)中∏有界且Lipschitz连续;Θ在[π,π]×b上有界,∞) 对于任意紧区间[π,π] R.然后ψ=u在[b]上,∞), 和∏(·)、Θ(π(·),·)是最优的马尔可夫控制。22.二汉贝拉克塔尔和余冲。和[7]一样,我们让 成为“合作国家”和[b,∞ )∪{} 成为[b]的一点压缩,∞). 定义u到[b]的扩展,∞) ∪ {} 通过分配u() = 0.1. 设w>b。通过条件(v)和(vi),SDEdWt=[rWt+(u)- r) π(Wt)- c] dt+σ∏(Wt)dBt,W=什么是唯一的强解Ww,W.r.t.过滤概率空间(Ohm, F、 F,P)。让π*t:=π(Ww,πt)并写入Ww,π*:= Ww,π。π*∈ A因为∏是有界的和可测的。定义τ*b:=inf{t≥ 0:Ww,π*≤ b} 和τ*:= inf{t≥ 0:Ww,π*≥ ws}∧ τd.Let Q∈ Q是具有相应漂移失真过程θ的任何候选度量。根据吉尔萨诺夫定理,BQt:=Bt-Rtθsds是Q-布朗运动。Ww,π*满意度DWT=[rWt+(u+σθt- r) π*T- c] dt+σπ*tdBQt,W=W。回想一下,τ是P-泊松过程N的第一跳时,其速率λ依赖于F。Q的定义表明N也是具有相同速率的Q-泊松过程。让我们,π*t:=Ww,π*t{t<τd}+1{t≥τd}。Ww,π*是放大过滤H中一个逐步可测量的过程,其中包括N生成的信息。
|