|
对于任何s=(w,p,q,r+,r-) ∈ S、 我们有vN+(S)=w+pq- 0.5 | q |和VI(s)=w+pq+gi(q,r+,r-), i=0,1,2。。。,N、 (4.4)其中gi(q,r+,r-) :=H+(0,τ、 r++H-(0, τ、 r-)- 0.5Eh | q- 1加注++1加注-|(r+,r-) = (r+,r-)i、 i=N,最大值(δ+,δ-)∈AsGi(q,r+,r-, δ+, δ-), i=0,1。。。,N- 1,(4.5)和Gi(q,r+,r-, δ+, δ-) := Egi+1(q,r+,r-) | (q,r+,r-) = (q,r+,r-), (δ+, δ-) = (δ+, δ-)+ H+act(r+,δ+)+H-act(r-, δ-).(4.6)定理4.2将值函数的计算从五个状态变量减少到三个状态变量(q、r+、r-) 在向后递归(4.5)中。如(4.4)所示,值函数vi(w,p,q,r+,r-) 可以分解为三部分:(1)w代表做市商当前的财富或现金;(2) pq是以中间价格标记到市场的存货价值;(3) gi(q,r+,r-) 表示遵循最佳策略的额外价值,该额外价值取决于做市商的未完成订单以及库存。特别是,存在库存罚款-0.5 | q |在tN+的终端时间出现,因为做市商需要通过使用市场指令和跨越买卖价差来平仓。(4.5)和(4.6)中的反向递归和最大化问题规定了当前期间的订单价值(未完成订单和行动中发送的新订单)与下一期间的预期额外价值gi+1之间的权衡。具体而言,术语H+act(r+,δ+)+H-act(r-, δ-) 在(4.6)中,是当前期间行动中未完成订单和新订单的价值。要看到这一点,请注意δ+,δ-∈ Z、 则当前期间未完成订单的生命周期为τ ; 否则(即,不采取任何行动),剩余订单将保留在订单簿中t在一个周期内。
|