|
当T→ ∞ 我们有(43)αj(t)=-θcB∞X(N)(t)+d∞Xj(t)+e∞\'-XN(t),其中参数(a∞, B∞, D∞, E∞) 满足代数Riccati方程:0=2(θ+H)a∞- 2θb∞+ θcb∞- θc,(44)0=(θ+H+θ)b∞- θd∞- θa∞+ θcb∞D∞+ θc- θe+θcb∞E∞,0=θd∞+ θcd∞- θc,0=-2θb∞+ 2θe∞+ θc(2d)∞E∞+ E∞).在这些条件下(X(N),\'XN)满足SDE:dX(N)=-HX(N)dt- θ(X(N)-\'-XN)dt+σ√NdWt,d’XN=-θ(°XN)- X(N))dt+σ√钕钨(N)t- θcB∞X(N)+(d)∞+ E∞)\'\'XNdt,其中W(N)t=√NPNj=1Wj(t)是标准的布朗运动。为了获得最优控制(43),我们需要有系数(b∞, D∞, E∞) 一般来说,这不能通过分析得到,必须通过数值计算得到。然而,我们能够在某些情况下找到近似解。我们注意到,从(44)开始∞= (-θ+pθ+θc)/θc,我们考虑以下情况:(1)如果θ=0,H=0,那么我们发现b∞= -D∞还有e∞= 0,这样我们就得到了系统dx(N)=-HX(N)dt+σ√σndd=NdWt‘√钕钨(N)t-pθ+θc(`XN- X(N))dt,14 JOSSELIN GARNIER,GEORGE PAPANICOLAOU和Zi-WEI Yango,这表明被动控制-θ(Xj)-X(N))和最优控制α以二次方式组合,形成反馈-pθ+θc(`XN-X(N))。(2) 如果0<θ 1和H=0,然后我们找到b∞= -D∞+θd∞/pθ+θc+o(θ)和e∞= -θd∞/pθ+θc+o(θ),得到系统dx(N)=-θ(X(N)-\'-XN)dt+σ√NdWt,d’XN=σ√钕钨(N)t-pθ+θc- θpθ+θc- θpθ+θc!(`XN)- X(N))dt,这表明最优控制选择减少反馈,可能是因为X(N)因θ而不稳定。(3) 如果0<θ 1和0<H 1,然后我们找到b∞= -D∞+ (H+θ)d∞/pθ+θc+o(θ,H)和e∞= -θd∞/pθ+θc+o(θ,H),所以我们得到系统dx(N)=-HX(N)dt- θ(X(N)-\'-XN)dt+σ√NdWt,d’XN=σ√钕钨(N)t-pθ+θc- (θ+H)pθ+θc- θpθ+θc!(`XN)- X(N))dt- Hpθ+θc- θpθ+θc\'XNdt,这表明最优控制选择减少反馈,但它也直接控制。6.数值结果6。1.函数的数值结果。
|