|
评估解的质量为了评估得到的解,我们发现主要需要考虑三个方面:(a)神经网络结构是否足够丰富?(b) 处罚的影响有多大?(c) 数值优化程序是否收敛到(接近)最小值?第A.2节展示了如何将其应用于示例案例。第(a)部分似乎是最简单的,因为我们发现第3.1小节中描述的网络结构的选择对于所有问题都是有效的,因为进一步增加网络大小不会改变获得的解决方案。关于(b)部分,最有用的观察结果如下:如命题1所述,通过神经网络的数值解可用于获得近似解u?关于原始问题。如果我们计算积分RFDu?与φθ,γ(f)相比,差值为φ*θ,γ(π?), 这可以看作是惩罚的结果。如果φ*θ,γ(π?)值很小,表示处罚效果很小。第二个观察结果是φθ,γ(f)在γ中增加,并且在命题1和命题2所研究的条件下收敛到φ(f)。因此,从较低的γ值开始并增加它,直到不再发生变化为止,这是一个好的策略。当这样做时,γ值太大当然会对(c)部分有害,因此,当增加γ时,通常需要同时调整训练参数(如学习率或批量)。关于第(c)部分,我们发现大多数不稳定性可以通过增加批量来解决。这种增长自然伴随着更长的运行时间。特别是如果γ必须大量增加以允许较小的惩罚效果,则需要非常大的批量(例如,在DNB案例研究中,我们使用的批量为2)。
|