|
为此,我们定义了拉格朗日函数L:Θ×R×Ohm -→ R如下(θ,ν,ω):=-u(I- Nt(ω))bλSHI-Nt(ω)-我-1Xi=Nt(ω)+1u(I- i) bλSHI-iEPkSH[θτi | Gt](ω)+νB(一)- Nt(ω))r+bλSHI-Nt(ω)+I-1Xi=Nt(ω)+1B(I- i) r+bλSHI-iEPkSH公司θτie-r(τi-t)燃气轮机(ω)- ub,c,并分别定义了对偶函数和对偶问题asg(ν,ω):=infθ∈ΘL(θ,ν,ω),(D)supν∈Rg(ν,ω)然后,我们有弱对偶不等式(其中val表示优化问题的值)-val(P)=infθ∈Θsupν∈RL(θ,ν,ω)≥ supν∈Rinfθ∈ΘL(θ,ν,ω)=val(D)。我们将对偶函数重写为如下g(ν,ω)=-u(I- Nt(ω))bλSHI-Nt(ω)+νB(一)- Nt(ω))r+bλSHI-Nt(ω)- ub,c+ infθ∈ΘI-1Xi=Nt(ω)+1ZOhmθτi(eω)νB(I- i) r+bλSHI-ie-r(τi(eω)-t)-u(I- i) bλSHI-我dPSHt,ω(eω),其中PSHt,ω是关于Gt原始(即未完成)版本的条件期望的正则条件概率分布。我们很容易就知道,将最优控制θν设置为θντi(eω):=1eω是最优的∈Aiν(eω),其中集合Aiν由Aiν定义:=Ohm, 如果ν<uBr+bλSHI-ibλSHI-我,eω:τi(eω)- t>rlnνBbλSHI-iu(r+bλSHI-(一), 如果ν≥uBr+bλSHI-ibλSHI-i、 因此,对于任何ν∈ R对偶函数具有以下形式,使用τi的条件定律- 给定的t是τig(ν,ω)=-u(I- Nt(ω))bλSHI-Nt(ω)+νB(一)- Nt(ω))r+bλSHI-Nt(ω)- ub,c+我-1Xi=Nt(ω)+1Z∞si(ν)νB(I- i) e类-rxr+bλSHI-我-u(I- i) bλSHI-我fτi(x)dx。(E.3)不难看出g是一个连续且可微分的函数。当我们想在对偶问题中最大化g时,我们计算它对ν的导数,得到g(ν,ω)=B(I- Nt(ω))r+bλSHI-Nt公司- ub,c+I-1Xi=Nt+1Z∞si(ν)B(I- i) r+bλSHI-ie-rxfτi(x)dx。自ν7起-→ 对于任何i=1,…,si(ν)都是非递减的,一、 gis不增加,单位为ν。
|