|
(24)我们考虑了两种不同的方法来计算F-可测系数akj,这是最小二乘法蒙特卡罗的一种变体,它吸收了最优停止文献[13]中回归后期方法的一些想法,以及直接鞅极小化方法,该方法建立在[2]和[9]的工作基础上,用于最优停止。作为基函数的一个关键假设,我们规定期望值Rkj(x):=ZRDbηkj+1(x,b)PBj+1(db),ZRDbDηkj+1(x,b)PBj+1(db), (25)x∈ RN以闭合形式提供(或可通过数值计算得出“可忽略”的误差),cp.下面的备注5.1。定义▄Yj=▄Yj(Xj-1,Bj)作为Yj的近似值,我们观察到Ej[βj+1Yj+1]=Pkakj+1Rkj(Xj)也是以闭合形式给出的。根据输入近似值y,我们现在可以推导出最优控制和末日马尔丁格尔M的第一个近似值*, 从中可以通过路径递归(8)和(16)获得输入子解和上解。为了计算这样一个控制@r,我们用Yj代替@Yj求解(7),即过程@r由@r给出jEj[βj+1Yj+1]- f#j(≈rj)=fj(Xj,Ej[βj+1Yj+1]),(26)每j=0。。。,J- 1,属于[5]中引理A.1的Athanks。当然,这里的凸共轭也可以用数值来近似。对于Doob鞅M的第一个近似值*, 我们再次用它的近似值Y代替真解Y。因此,第一个近似值为M*由Mj=j给出-1Xi=0βi+1Yi+1-Ei[βi+1Yi+1],j=0。。。,J、 (27)将▄r和▄M插入θlow和θup的递归(8)和(16),我们得到了输入子解和上解Y(low,0)J=Ej[θlowj(▄r,M)]和Y(up,0)J=Ej[θupj(▄M)]。我们现在可以对∧outindependent副本(Bj(λout),j=1,…)进行采样,J) )λout=1,。。。,∧在B中,我们称之为“外部”路径。
|