|
,wT):W×·W→ [0, 1].(如果t=1,这是无条件密度。)我们通过对所有其他扰动进行积分,得出每个未来扰动的边际密度,^fwt | t(wt),^fwT | t(wT)。我们用这些边缘的乘积来近似未来扰动的密度,所以它们都是独立的。然后,我们使用Bellman方程(17)和(18)计算具有后向递推的成本函数,其中每个扰动wτ的期望值取条件边际密度^fwτ| t。成本函数的方程(17)在任何时候都变为(注意下标·| t)vτ| t(x)=mine710fwτt[gτ(x,u,wτ)+vτt+1 | t(fτ(x,u,wτ)],(21),T,与通常的最终条件相同。类似地,对于所有时间τ=t,…,最优作用的方程(18)为:,T当我们在下一步中使用SVT+1时,我们只使用SVT+1,vT | t+1(x)使用更新的边际条件密度,然后求解(22)得到ut+1。有了这个框架,我们可以解决我们在§2.4.4 VWAP问题中提出的VWAP问题,因为LQSCWe现在在§4.2的框架中阐述了§2中描述的问题。对于t=1,T+1我们将状态定义为:xt=Pt-1τ=1uτPt-1τ=1mτ, (23)所以x=(0,0)。动作为ut,即我们在区间t内的交易量,如§2所述。干扰是WT=mtV(24)其中第二个要素是总市场容量V=PTt=1mt。根据这一定义,扰动并非条件独立。在§4.5中,我们研究了它们的联合分布和边际分布。
|