|
例如,“Q'p'tq'Q'Q'Q,VN:'BtVN“maxpPr0,1s^gppq'pBQVN'2Npp1'pqBQVN'。(2.9)我们使用N“1这一事实来解HJB方程。命题2.4.在确定性极限N”8中,函数vpt,Qq:“p'tqg'QQ1't'(2.9)'Qp'tqq'Q'Q'pdetpt,Qq:“\'\'Q'Q1't.Proof。约束可以包含在拉格朗日函数中。分辨率为λmaxpspsqtdsd1Ar0,1sztgppsqds'λ710ztpsds'Q729;。通过对tops进行形式化推导,我们得到了gppsq'λ,这意味着通过严格的凹凸常数。因此,唯一保证\'Q'Qisps的值“\'Q'Q1't,结果从何而来。l3近似解3.1性能比我们在本节中的目标是找到最佳阈值策略的闭合近似公式。为了确定近似值是否满足要求,我们将引入性能基准。借助离散动态规划,我们可以计算最佳策略及其预期回报性能最优。类似,我们可以计算阈值策略的预期回报perfDeterministicPt“pdeto Pt将是从确定性策略获得的预期回报与最佳策略的比率:绩效比率“perf'perfdeterministicperfoptimal'perfdeterministic,其中我们用perf表示pt下的预期收益。我们实施一个数值方案以获得最优解,并将其作为基准,参见附录B.3.2近似问题我们可以利用2n!1的事实来获得(2.9)的近似解. 我们在方程中使用近似值Bqvn<<BQVin。请注意BQVPT,Qq“p1'tq'1g'Q'Q1't'p1'tq'1gpptq。然后要解决的问题变成了SV pt,Qq:“maxppsqtdsd1Ar0,1s,stpsds”'Q'QE'Ntgppsq'gppsqNp1'TQPS1'psqds eff。(3.10)请注意,如果积分的最终界限为p1',问题(3.10)将不适定tqt'Y~n问题的值在时间1'N为零。
|