|
什么时候 由于P=e,我们的离散时间近似值与有限差分格式几乎相等Q=I+Q + o().最后,每k≥ 0,我们定义分段常数过程U关联到Unsuchthat:▄Ut=英国,t型∈ [k], (k+1)).我们用▄V表示(t,U)状态过程为▄U的控制问题的值函数. 然后我们得到以下误差估计结果。定理4。对于每个州u=qbef、qa、qaft、q、i、p、pexec, 我们有| V(t,u)- V(t,u)|≤ R(T-t), (9) R=4cqaH,H在假设2中定义。这确保了离散近似的收敛性:~V(t,u)→→0V(t,u)。此外,序列uOpti,与工艺相关的?Uutsatis fiesuOpti,→→0uOpti,a.s,(10),其中uOpti是与连续时间控制问题相关的最佳控制。附录G中给出了该结果的证明。当 很小,上述误差估计值对P=I+Q有效 (即有限差分方案),见附录G.5数值试验在本节中,我们展示了两种框架中最优策略的相关性:当以固定频率进行决策时-1以及在任何时候拍摄的时间。为了做到这一点,我们比较了我们的策略和标准策略给出的最佳收益加入竞价:以最佳竞价保持在订单中,直到最后一刻。在这里,我们写下Q(resp.Q)来表示最佳出价(resp.ask)限制。5.1最佳增益的计算:在给定频率下作出的决定-1图4显示,对于大小为1的订单,最优策略的平均收益(即初始值函数)与加入初始Qand Q不同值投标的策略之间的差异。最优策略的收益显然总是高于订单中保留的策略的收益。
|