驱动程序有两个随机性来源:依赖于多级算法中使用的样本的随机函数(y(k,M),z(k,M))和马尔可夫链X(k)。符号f(M)j(x,x,y,z):=fjx、 y(k,M)j+1(x)+y,z(k,M)j(x)+z,将在续集中有所帮助。为了方便读者,我们简要回顾了LSMDP算法。与第3节中的算法一样,LSMDP是一种最小二乘蒙特卡罗算法;2018年6月3日14时28分的差异331 2 3 4 6 7-2.-1.5-1.-蒙特卡罗法的0.50log2(N)log10(MSE)BSDE近似- Z MDP方案中的均方误差(MSE)(线性基础)MDP方案(指标基础)图3:3维MDP的Z中的均方误差(MSE)与第3节的多级算法相比,基函数的选择和模拟的生成有三个方面:首先,由于没有使用多个级别,只生成Markovchain X(k)的模拟;其次,为每个时间点生成独立的模拟云,这意味着每个时间点的经验度量独立于在任何其他时间点使用的经验度量;第三,基函数的选择与多级方案不同。我们通过以下定义将其正式化。定义4.1(有限维近似空间)。因为我∈ {0,…,2k-1} 我们定义了函数线性空间KY,iand KZ,iof维KY,iand KZ,i,由KY,i:=span{p(1)Y,i,…,p(KY,i)Y,i},对于p(l)Y,i:Rd→ R s.t.E[|p(l)Y,i(Xi)|]+∞,KZ,i:=span{p(1)Z,i,…,p(KZ,i)Z,i},对于p(l)Z,i:Rd→ (Rq)>s.t.E[|p(l)Z,i(Xi)|]+∞.我们在基函数和线性空间的表示法中抑制下标k,以区别于定义3.2中的下标k。函数“yi(·)”和“zi(·)”将分别在线性空间KY、i和KZ、i中进行近似。将以KZ,i近似。
|