|
具体而言,系统处于e状态:=(j、vb、va、p、z、y)∈ E表示:o询价/投标价格变化等于j勾号;obest bid(resp.ask)队列包含vb(resp.va)单位订单;oask价格等于pε;o代理人在前一决策期发布的限额指令的执行部分为z单位大小;o代理的剩余库存头寸为y单位大小。3.1.2。动作空间。动作空间A:={0,…,m}×{0,…,l},带m,l∈ N+,表示交易策略集,即代理选择以最佳出价和要价分别提交和发布的市场和限制订单的金额(单位大小)。常数m(对应l)表示代理允许交易的单个市场(对应限额)订单的最大金额(单位大小)。根据假设2.6(c)(e),代理人在状态e下的容许行动空间∈ E由(3.1)A(E)定义:=(米,升)∈ A:m<vb,m+l≤ y,这样代理就永远不会耗尽整个最佳出价队列,也不会卖空。所有可行状态动作对的集合用K表示:={(e,α)| e∈ E、 α∈ A(e)}。3.1.3。半马尔可夫核。在介绍下一个概念之前,请回顾以下定义。定义3.1(亚/半马尔可夫核)。让(Ohm, F) 以及(Ohm, F) 成为真正可测量的空间。A映射p(···):F×Ohm→ [0,1]被称为Ohm鉴于Ohm如果:o对于任何ω∈ Ohm, p(·|ω)是(Ohm, F) 带p(Ohm|ω)≤ 1、 o对于任何F∈ F、 p(F |·)是一个Borel可测函数。特别是,如果p(Ohm|ω) =1表示所有ω∈ Ohm, 那么p(····)是Ohm鉴于Ohm.
|