|
最优投资政策表示为:θ*t=ut- rγtσe-r(T-t)-(StE*t[RTtγ(us-rσs)ds]St+ρνtσtE*t[RTtγ(us-rσs)ds]St)e-r(T-t) (3.28)其中预期投资组合收益表示为:ft=f(St,Xt,t)=E*t[ZTtγ(us- 对冲中性措施下的rσs)ds](3.29)*, 其中,具有相关ρ的两个标准布朗运动由:dw给出*t=dwt+ut- rσtdt,dw*Xt=dwXt+ρut- rσtdt(3.30)P到P的Radon-Nikodym导数*由:dP给出*dP=e-RT(us-rσs)ds-RTus-rσSDW(3.31)以市场本身为特征。对于分析解决方案无法注意到必须在对冲中性措施下进行模拟的情况*, 部分导数可以重写为Malliavin导数,以便通过蒙特卡罗进行调整。3.3博弈论解释我们回顾,对于DMVO,时间不一致性是阻碍动态编程的障碍。我们使用总方差的“神奇”公式处理了这个问题。然而,这并非纯粹的巧合。在推导HJB方程时,我们假设我们已经选择了最优策略,即在博弈中达到纯策略纳什均衡。更准确地说,我们假设在投资期的每个时间点都有很多参与者【0,T】。每个参与者采取一个投资策略θtsuch,即值jtt,TJtJθt,St,Xt,tθt。纯策略纳什均衡点θ*应满足以下两个条件:o固定时间t。对于任何时间s∈ (t,t),站在时间s处的玩家将对θ作出反应*.o给定目标函数jt和财富约束,θ*也应该是站在t的玩家的最优策略。因此,如上所述的平衡点应该满足HJB方程3.14,并且与我们的最优策略一致,该最优策略采用明确的形式3.28.3.4对最优最终财富结果的分析:owtwtρwtwXt。
|