|
状态变量为剩余容量R=(R1→2,R2→3) ′=nc-ANc,其中矩阵A在(35)中给出。我们使用状态变量的线性函数作为控制函数C=(c1→2,c2→3,c1→2.→3) ′,即基函数为φ1,1→2(R)=(1,0,0)′,φ1,2→3(R)=(0,1,0)′,φ1,1→2.→3(R)=(0,0,1)′,φ2,1→2(R)=(R1→2,0,0)′,φ2,2→3(R)=(0,R1→2,0)′,φ2,1→2.→3(R)=(0,0,R1→2) ′,φ3,1→2(R)=(R2→3,0,0)′,φ3,2→3(R)=(0,R2→3,0)′,φ3,1→2.→3(R)=(0,0,R2→3) ′。我们将周期t的控制参数表示为θt=(θt,k,l)k=1,2,3,l∈{1→2,2→3,1→2.→3} 。然后,控制ctisct=Xk=1Xl∈{1→2,2→3,1→2.→3} θt,k,lφk,l(Rt)。然后,我们将EM-C算法应用于该问题。我们在模拟中使用N=10000个采样路径,在SA算法中使用m=2000个迭代。初始控制参数candθtar设置为c=(100,100,100′)和θt,1,l=100,θt,2,l=θt,3,l=0,l、,t、 图3显示了EM-C算法在6次迭代中的目标函数值。EM-C算法经过5次迭代后收敛。似乎(严格的)EM-C算法比两种启发式算法MTO和MTS产生的收入要高得多。表2比较了EM-C算法、MTO、a和MTS分别获得的收入分布,使用N=10,0000 1.721.741.761.781.81.821.841.861.88×10EM CMTSMTOFigure 3:两种启发式方法的目标函数值,MTO和MTS,以及(严格的)EM-C算法。EM-C算法经过5次迭代后收敛。它在模拟中使用N=10000个样本路径,在SA算法中使用m=2000个迭代。在Matlab程序下,每次迭代需要1.3小时。该程序的瓶颈是SA算法的迭代,该算法需要在Matlab中通过“for循环”来实现,这是众所周知的缓慢过程。
|