|
然后,公式(2.4)和(2.5)得出rj的公式-1<r≤ rj,v(r)=rj+√1.- r-Rjp1- rj+nXk=j+1Rkp1级- rk公司-1.-√1.- rk公司,λ*(r) =2cj√1.- rRjp1- rj公司-nXk=j+1Rkp1级- rk公司-1.-√1.- 国际扶轮社.我们声称平衡态ρ由ρ(t)=1给出-p1级- rj公司-1.-Aj4cj(t- tj公司-1), tj公司-1.≤ t型≤ tj,(2.7),其中Aj=Rjp1- rj公司-Pnk=j+1Rk(√1.- rk公司-1.-√1.- rk)和tjis由tj=tj递归定义-1+4cjAj(p1- rj公司-1.-p1级- rj)和t=0。应按照1/0=∞; 实际上,我们有Aj=0和tj=∞ 如果(且仅当)Rj=Rj+1=····=Rn。如(2.7)所示,我们可以依次求解每个间隔的ODE(2.2)[rj-1,rj]。设t=0。假设我们已经找到t,tj公司-1和ρ(t)表示t∈ [0,tj-1]. 然后第j个间隔上的代码读取ρ′(t)=Aj2cjp1- ρ(t),初始条件为ρ(tj-1) =rj-1解由(2.7)给出,而tjis通过条件ρ(tj)=rj确定。最后,让β∈ (0,1)。如有必要,通过向网格中添加β,我们可以在不丧失一般性的情况下假设β=rj,对于某些j∈ {1,…,n},然后β分位数是Tβ=tj=Pjj=14cjAj(p1- rj公司-1.-p1级- rj)。3平均场委托-代理问题我们已经看到,对于给定的奖励方案R,存在唯一的(确定性)平衡状态ρ,因此对于α∈ (0,1),时间tα(R)=inf{t≥ 0:ρ(t)≥ α} ∈ (0, ∞]具有确定性且定义明确。这是人口的α-比例达到目标之前的时间,或者等效地,Tα是平衡到达时间τ分布的α-分位数*.在本节中,我们确定α∈ (0,1)且总奖励预算B>0,并根据约束thattrr(R)dr最小化Tα(R)的奖励方案R≤ B、 这对应于第二个最佳意义上的委托代理问题:规划者可以为代理设定奖励,但不能支配他们对控制的选择。
|