|
(4.4)从tN=T开始,我们可以在时间方向上向后传播到T=0,并得到估计的初始值Y(j)θ(j)对于每个采样路径,其中θ(j)=nθ(j),···,θ(j)n-1第j个MC路径的每个时间步都是神经网络的超参数。理想情况是估计初始值Y(j)θ(j)专注于一点。因此,损失函数定义为:反向=平均所有路径Y(j)θ(j)- 平均所有路径Y(j)θ(j). (4.5)这意味着我们正试图最小化估计初始值的方差。Adam优化用于最小化损失函数LBackwardand估计YasfY=平均所有路径Y(j)eθ(j), (4.6)式中,eθ(j)=arg minθLBackward。(4.7)最后,估计值是我们在t=0.4.2最小二乘回归时的期望导数。我们使用百慕大看涨期权来解释如何使用最小二乘回归估计的支付的条件期望来确定早期执行时的最佳策略。读者可参考文献[13]中的经典论文了解更多细节。在不丧失一般性的情况下,我们假设练习时间为tk∈ π={t,···,tN}。主要思想是采用回归方程,例如,Yk=a+bXk+cXk+v,(4.8),其中v是白噪声,v是白噪声~ N0, η. 预期导数值为estimatedasEYk=a+bXk+cXk。(4.9)在练习时,对所有具有正调用值的货币内路径执行上述最小二乘回归。请注意,最小二乘回归中可以使用其他基函数,例如加权拉盖尔多项式,这在本文中由[13]使用。通过比较调用值(即即时运动值)与continuationYk=(Ykif-EYk)派生值的期望值,可以确定运动时间的最佳策略≥ 如果EYk<调用值(tk,Xk),则调用值(tk,Xk)。
|