|
在这种情况下,我们以与等式(a.1)类似的方式围绕条件值“at,”“yt”展开:yt=”“yt+δyt,at=”“at+δat(a.4),以便线性化点位于等式中。(A.1)和(A.4)的关系如下:(\'ut,\'xt)≡ (1吨-1年1月1日)。根据增量δzt将公式(A.2)和公式(13)叠加在一起,我们可以写出δyt的线性化方程如下:δyt+1=ψ+ψyδyt+ψAδat+εyt(δyt,δat)(A.5),其中ψ=Ohm(一)- Φ) o(R)zt-(R)zt+1, ψy=Ohmx个Ohmz0 I- Φ, ψa=Ohm美国犹他州-1.(A.6)εyt(δyt,δat)=εto (xt+ut)εzt=εtoTyt+1T-1at公司εzt注意,矩阵ψ、ψy、ψ通过其对“ytand”at的依赖性而与时间相关。还要注意,式(A.5)表示Cδyt+1≡ Et,a[δyt+1]=ψ+ψyδyt+ψaδat∑y≡ Cov[δyt+1]=∑xx0∑z(A.7)∑xx=∑roh类Tyt+1T-1at公司Tyt+1T-1at公司t我们还可以用δyt和δat表示奖励公式(22):^Rt(yt,at)=δaTt^Raaδat+δyTt^Ryyδyt+δaTt^Rayδyt+δaTt^Ra+δyt^Ry+r(\'yt,\'at)(A.8)这里我们定义了^Raa=Raa,^Ryy=Ryy,^Ray=Ray,^Ra=Ra+2Raa'at+Ray'yt,^Ry=2Ryy\'yt+RTay\'at(A.9)r(\'yt,\'at)=\'aTtRaa\'at+\'yTtRyy\'ytray\'\'ytray\'\'yt+\'attrare将其作为奖励函数系数Raaetc的原始参数调用。根据原始模型参数、新的“帽子”系数^Raaetc确定。现在是原始模型参数和条件变量“yt,”at的函数。A、 2对于G函数的递归在本节中,我们考虑一个有限的地平线设置。在这种情况下,系数的时间依赖性将隐含在下面的方程式中,并将由额外的上脚本进行补充,例如:。
|