|
最后,我们选择的批大小为32,因为高于此级别的批大小的性能相似,较大的批大小通过一次计算更多的梯度来增加计算时间。在我们的培训设计中,我们使用了许多正则化技术来加速培训的收敛,避免过度匹配并提高网络性能。1) 提前停止:我们选择200个epoch,如果25步测试集的错误没有改善,则停止更新网络参数。2) 模型参数归一化:通常,模型参数仅限于给定的域,即θ∈ [θmin,θmax]。然后,我们执行以下归一化变换:2θ- (θmax+θmin)θmax- θmin∈ [-1, 1].3) 隐含波动率的归一化:隐含波动率的归一化是一个更微妙的问题,因为σBS(T,k,θ列)∈ [0, ∞), 因此,对于每个T和k,我们选择标准化曲面减去样本经验平均值,再除以样本标准偏差。3.3校准步骤一旦找到隐含波动率的定价图近似值,只剩下校准步骤(2)求解。一般而言,对于金融模型,定价图F*假设其所有输入参数θ都是平滑的(至少Cdi可微)。基于梯度的优化(2)中优化的标准一阶必要条件是θδeF(M(θ),ζ),PMKT(ζ)= 0,(19),前提是目标函数是光滑的。然后,自然更新规则是通过梯度下降沿梯度移动,即θi+1=θi- λθδeF(M(θi),ζ),PMKT(ζ), λ > 0. (20) 基于(20)的梯度优化方法的一个共同特点是使用梯度θδeF(M(θ),ζ),PMKT(ζ), 因此,其正确和精确的计算对于后续的成功至关重要。
|