|
请注意,如果延迟,当发送新的ask订单时,未完成的ask订单将立即取消τ = 0. 在这些情况下,做市商不应引用新的询价单,或应使用买入市场订单,以使投资保持在限制范围内,即δ+∈ {∞, o} 或δ-= -∞. 同样,我们将库存上限q的集合定义如下。S:=({(w,p,q,r+,r-) ∈ S:q=q},τ=0,{(w,p,q,r+,r-) ∈ S:q=q或q=q- 1,r-< ∞}, τ > 0.(A2)然后,状态s的容许作用空间由下式给出:={∞, o} ×Zo∪ Zo×{-∞}, s∈ S{-∞} ×Zo∪ Zo×{∞, o} ,s∈ S、 Zo×Zo,否则。(A3)A.2系统动力学对于我们的MDP模型,我们现在描述MDP离散系统状态的动力学,即si,i=0,1,2。。。,N、 N+。对于i=0,1。。。,N- 1,表示决策者的第i个行动/决策(δ+i,δ-i) 。对于周期i=0,1。。。,N、 我们使用两个指示器函数1fill+I和1fill-ito指定在时间ti时,询问和出价是否未完成订单(如有)- 分别在时间ti+之前填充(如果未填充,则为0)。注:如果做市商在第i次行动中发出取消指令,这些未完成订单将在时间ti+时取消。类似地,对于i=0,1,2。。。N-1,我们使用两个指示器函数1fill+i+和1fill-i+指定制造商在时间间隔【ti+,ti+1】内是否有任何询价和投标订单。如果制造商在时间间隔【ti+,ti+1】发出新订单和取消指令-,然后1加注+i+和1加注-i+指定是否在时间ti发送订单- 填写在【ti+,ti+1】中。否则,如果制造商没有在ti发送任何新订单或取消指示-,i、 e,δ+,δ-= o、 然后,这两个指标函数指定是否在[ti+,ti+1]中填写未完成订单(如果有)。
|