|
该算法是在成批随机采样的时间和空间点上训练的,因此是无网格的。简要回顾DGMIn一般情况,考虑具有d空间尺寸的PDE:ut(t,x;θ)+Lu(t,x)=0,(t,x)∈ [0,T]×Ohm,u(t,x)=g(t,x),x∈ Ohm,u(t=0,x)=u(x),x∈ Ohm (54)其中x∈ Ohm Rd和L是所有其他偏导数的算子。目标是用深度神经网络f(t,x;θ)逼近U(t,x)。此处θ∈ Rk是神经网络参数。我们希望最小化与问题(54)相关的目标函数,该问题由三部分组成:1。衡量近似值满足PDE的程度:ft(t,x;θ)- Lf(t,x;θ)[0,T]×Ohm,ν. (55)2. 衡量近似值满足边界条件的程度:ft(t,x;θ)- g(t,x)[0,T]×Ohm,ν. (56)3. 衡量近似值满足初始条件的程度:ft(0,x;θ)- u(0,x)Ohm,ν. (57)这里,所有三个误差都是根据L-范数来测量的,即kf(y)kY,ν=RY | f(y)|ν(y)dy,其中ν(y)是区域y上的密度。以上三个项的总和为我们提供了与神经网络训练相关的目标函数:J(f)=ft(t,x;θ)- Lf(t,x;θ)[0,T]×Ohm,ν+ft(t,x;θ)- g(t,x)[0,T]×Ohm,ν+ft(0,x;θ)- u(0,x)Ohm,ν. (58)因此,目标是找到一组参数θ,使函数f(t,x;θ)使误差J(f)最小。当维数d较大时,通过直接最小化J(f)来估计θ是不可行的。因此,我们可以使用一种机器学习方法来最小化误差J(f):随机梯度下降,其中我们使用随机抽取的时间和空间点序列。下面的算法1描述了DGM方法的算法。备注1。
|