|
数值解HJB方程(4.12)~(4.14)可以改写为恭维问题的标准形式,如下所示:-ρv(z)+L(π)*,^c*,^q*)v(z)+^c*β1-γ≤ 0,Mv(z)- v(z)≤ 0,- ρv(z)+L(π)*,^c*,^q*)v(z)+^c*β1-γMv(z)- v(z)= 0,(5.1),其中M v由(4.9)和(^π)给出*, ^c*, ^q*) 通过最大化(4.13)获得。系统(5.1)为隐式非线性互补问题(NLCP),L和Mv均取决于未知函数v。可通过Seydel(2010)提出的停止时间迭代程序获得(5.1)的解,如下所示。另见Chancelier等人(2002年)。价值函数可以首先通过考虑从不交易耐用商品的次优策略来初始化。通过求解HJB方程得到次优值函数- ρv(z)+L(π)*,^c*,^q*)v(z)+^c*β1 - γ=0,(5.2),仅随机控制。通过数值求解(5.2),我们获得了值函数的第一次次次优估计。假设得到了当前估计值Vn,我们用当前估计值Mvn替换未知干预值函数Mv来求解显式NLCP(5.1),从而得到下一个值函数估计值Vn+1。此过程可继续进行,直至收敛。这包括求解算法的“主循环”。请注意,vn表示允许代理在n个未来停止时间交易耐用货物时的值函数。随着允许更多的耐用商品交易,价值函数得到改进,因此vn+1≥ 越南。次优值函数序列(vn)单调收敛于v→ ∞. 算法1概述了主循环。显式NLCP的解决方案,即“内环”,可以通过迭代求解一系列线性互补问题(LCP)来获得。
|