|
对于每个点(x,t),使用从等式28中采样的N=10000条轨迹计算近似值函数。我们在面板A中显示t的近似值函数∈ {0, 0.75, 1 - dt}和面板B中相应的近似控制策略u(x,t),以及u(x,t)的平滑版本,我们用虚线表示。面板C显示Yt的实现情况,Yt是生成计算解决方案所依据的度量的过程。分析控制策略att=T由u(T)=-[δ(x- 1) - δ(x+1)]。图中显示了近似值函数V(x,t)及其相应的近似控制策略u(x,t)=-V(x,t)x、 我们在Nx=500线性间隔xn的网格上计算这些近似值∈ [-2, 2].由于近似的u(xn,t)是有噪声的随机函数,我们也在图7中绘制了它们的平滑版本。这些平滑版本由我们定义(xn,t)=kXn=-ku(xn+n,t)。(29)我们设置k=7,因此,我们(xn,t)是2k+1=15,噪声较大的u(xn,t)的逐步移动平均值。作为t→ T,us(xn,T)逼近T=T时控制问题的解析解,由u(x,T)给出-[δ(x-1) - δ(x+1)]。在进一步限制的情况下,当一方有可信的承诺来执行常数控制策略v(t)=v时,我们可以得到进一步的分析结果。在此假设下,与等式28对应的概率定律由u(y,t)给出=√2πσtexp2σt[(y- x)- vt], (30)使(指数变换的)值函数读取Д(x,t)=Eu(y,t-t)经验值-λv2σ(T- t) Φ(YT)(31)=扩展-λv2σ(T- t) op2πσ(t- t) ×(32)∞Z-∞经验值-2σΦ(y)+(y- x)- v(T- t) )t- t型dy.对于许多Φ(y),可以精确计算该积分,对于许多其他最终条件,可以使用拉普拉斯方法近似计算该积分。当t→ 所以方程中指数的变元的分母。
|