|
回想一下,当核G=Gρ“收敛”到狄拉克的δ测度ρ时,我们启发式地得到了最优策略→ 如第2节开头所述,我们继续假设I是一个cádlág马尔可夫过程,但我们添加了一个假设eι|It |]≤ C(T)(1+|ι|),适用于所有ι∈ R、 0个≤ t型≤ T、 (3.1)对于某些常数C(T)>0。为了简单起见,我们假设Mt=σPWtso thatdPt=Itdt+σPdWt,其中{Wt}t≥0是布朗运动,σpis是正常数。在下例中,可接受策略上的燃油约束将用终端惩罚函数代替。这使我们能够在Cartea和Jaimungal的框架内考虑绝对连续的战略(参见[12,13,14])。我们引入了一些与此设置相关的其他定义和符号。设V表示一类渐进可测控制过程r={rt}t≥0对于其| rt | dt<∞, P-a.s.适用于任何x≥ 0我们定义=x-Ztrtdt。(3.2)这里xrti是交易者在时间t持有的库存量。我们通常会抑制r中X的依赖性,以简化符号。受线性瞬时市场影响的价格过程由t=Pt给出- κrt,t≥ 0,其中κ>0。注意,当G(dt)=κδ(dt)时,s对应于(2.2)。投资者的现金流量:=现金流量=(Pt- k rt)rtdt,C=C。为了与Cartea和Jaimungal在[12,13,14]中的早期工作保持一致,我们将清算问题定义为现金和风险规避之间差异的最大化。
|