在连续系统动态规划中,
max(定积分)f(x,u,t)dt
s.t. dx/dt=g(x,u,t), x0给定
求解HJB方程为
max[f(x,u,t)+Jx(x,t)*g(x,u,t)]=-Jt(x,t)
对u求导,得到最优化条件
0=fu(x,u,t)+Jx(x,t)*gu(x,u,t)
这里gu,fu,Jx,Jt,u,x,t都是下标,偏导的意思,J是值函数
今天困扰了我很久的一个问题,就是值函数J对于x和t的偏导应该如何求解,希望能指点小弟!谢谢了



雷达卡






京公网安备 11010802022788号







