|
所以我们尝试γ=0和γ=0.15壁障反向敞篷车:d=3个库存,T=12个时间步长,步长为t=1/12,采样测量参数γ=0。最后一个与最小投入相同,意味着定理3.1和3.4都成立。在[FAF20,第5节]中,使用实践中经常使用的模型构建保险责任模型,其中d=5。对于最小put和最大调用,我们有d=6,路径空间的维数E=RdTamounts到12;对于壁障倒车敞篷车,这些值分别为3和36。实际上,这些例子可以被认为是高维的。根据上述参数规格,我们生成一个大小为n=2×10的训练样本X,并使用scikit学习库的高斯过程回归(GPR)模块【PVG+11】。事实上,GPR的表达式与我们在引理4.1中对样本估计量FX的表达式相同,请参见【RW06】。使用探地雷达的优点是,通过最大化似然函数可获得一些最佳超参数值α、β和λ【RW06】。这是标准验证步骤的另一种选择,在标准验证步骤中,需要为每个超参数指定一个网格,这可能会导致繁琐而冗长的计算,正如我们在示例中所经历的那样。相反,对于GPR,我们只需要指定每个超参数的值范围,这里我们选择α∈ [2.8 × 10-5, 83], β ∈ [10-9,0.15]和λ∈ [10-12, 10-3]. 表1显示了最佳超参数值。我们注意到,所有最佳值都在其预先规定的范围内。Payofffαβλ最小投入2.06×10-20 1.86 × 10-8Max调用(γ=0)2.53×10-20 3.33 × 10-8Max调用(γ=0.15)3.66×10-23.25 × 10-94.14 × 10-8托架倒档敞篷车2.96×10-30 9.20 × 10-8表1:GPR的最佳超参数值α、β、λ。然后,我们计算估计值过程VX,tat时间步长t∈ {0,1,T}使用引理4.1,(28)和(33)。
|