如题,前提是single agent problem
根据我的了解,在DP中递归的backward induction要求目标方程必须是homogeneous,但如果存在model forward updating的话目标方程就不满足这一条件,会给递归解法带来问题 (一个简单的例子,比如目标方程里的概率要根据每时期的nature realization进行bayesian updating)
听说如果存在双向求解的时候问题就被归结为fixed point problem,请问这个是类似于game theory一样的问题么?因为game theory更类似于multi-agent DP...
如果有人知道解法大概的思想,请不吝赐教,如果有推荐的阅读材料最好
万分感谢!


雷达卡



京公网安备 11010802022788号







