|
,m.在本文的数值示例中,我们使用了Broadie、Cicek和Zeevi(2011)中的缩放和移位随机近似(SSSA)算法,其中序列ak和Bk被选择为ak=k-1·A和bk=k-1/4·b,其中A和A有一些初始向量,通常选择与y的比例成比例。附录D一般控制问题的EM-C算法(6)EM-C算法也适用于效用函数不可时间分离的一般控制问题(6)。在这些问题中,(9)不能再简化为(10)。为了使EM-C算法适用于此类问题,在迭代k的每个周期,只需将θkt设置为次优(最优)解maxθt∈ΘtEu(s,c,s,c,…,sT-1,cT-1,sT)ck公司-1,θk-1.θk-1吨-1,θt,θkt+1,θkT-1..(48)收敛定理1、2和3也适用于一般控制问题的EM-C算法(6)。在对一般控制问题(6)实施EM-C算法时,需要解决子问题(48),其中目标函数为:Eu(s,c,s,c,…,sT-1,cT-1,sT)ck公司-1,θk-1.θk-1吨-1,θt,θkt+1,θkT-1.= E“NNXl=1u(s,c,sk1,l,ck1,l,…,skt,l,ckt,l(θt),…,skt-1,l(θt),ckT-1,l(θt),skT,l(θt))#。然后,SA算法可以使用▄f(θt):=NNXl=1u(s,c,sk1,l,ck1,l,…,skt,l,ckt,l(θt),skT公司-1,l(θt),ckT-1,l(θt),skT,l(θt))作为求解子问题(48)时目标函数的近似值。参考Bertsekas,D.(1999年)。非线性规划,2 edn,Athena Scientific,Belmont,Massachusetts。Bertsekas,D.P.(2012年)。动态规划与最优控制:近似动态规划,第二卷,第4版,雅典娜科学出版社,马萨诸塞州贝尔蒙特。Bouchard,B.和Touzi,N.(2004)。
|