|
为了满足套期保值头寸的约束,对神经网络^C(θj;^Stj,^)的输出进行tanh变换j) 允许在中有输出[-1,1]d.算法2第一个局部分辨率算法的后向分辨率(鞅情况)1:UN(^StN(ω),^N) =g(ST),^N∈ [0,1]d,2:对于j=N- 1,N- 2.1 do3:用于x∈ U(0,1)dθ*j=arg minθEUj+1(^Stj+1,ψj+1(φj(θ;^Stj,x)))- φj(θ;^Stj,x)。(Ftj+1- Ftj)-^Vj(θ;^Stj,x)|Ftj公司, (19) 式中φj(θ;^Stj,x)=ψ-1j(x)+l tanh(^Cj(θ,^Stj,x))4: Uj(,.)=^Vj(θ*j、 .,.)5: 最后:arg minp∈R∈[-l、 l]Eh(U(^St,ψ()) - C、 (英尺- 英尺)- p) i5.2第二个局部算法第二个算法可以被视为第一个算法的路径泛化,其中在每个时间步,都会实现优化,以使用先前计算的命令计算当前时间步的值函数和命令。在该算法中,增益函数R由ω更新ω。然后,在Ti日,以资产价值或投资我-1日期为ti的客户-1: R(ti、Sti、,我-1) =g(ST)-dXk=1N-1Xj=i千焦(Fktj+1- Fktj),=(R)R(ti+1,Sti+1,(一)-dXk=1ki(Fkti+1- Fkti),如Warin(2019)所示,在第十一天,最佳控制 与最小化问题相关:min(V,)∈R×RdE“((R)R(ti+1,Sti+1,) -dXk=1k(Fkti+1- Fkti)- V)| Fti#。这导致了第二个算法3。算法3第二个局部分辨率的向后分辨率算法1:对于j=N- 1,N- 2.1 do2:用于x∈ U(0,1)dθ*j=arg minθEg(ST)-N-1Xk=jk、 (Ftk+1- Ftk)-^Vj(θ;^Stj,x)|Stj公司, (20) 在哪里j=φj(θ;^Stj,x)k+1=φk+1(θ*k+1,^Stk+1,ψk+1(k) )对于k∈ [j,N- 2] φk(θ;^Stk,x)=ψ-k为1k(x)+l tanh(^Ck(θ,^Stk,x))∈ [j,N- 1] 3:最后:arg minp∈R∈[-l、 l]E“(g(ST)-N-1Xk=0k、 (Ftk+1- Ftk)- p) #每个优化都使用随机梯度下降实现。
|