|
注意,由于Y是有限状态马尔可夫链f(Yt)=hf,所有t的Yti∈ [0,T],其中h,i表示Rk上的标量积,且fi=f(ei),i∈ {1,…,K},因此马尔可夫链的函数可以用K向量识别。让所有t∈ [0,T]和i∈ {1,…,K},πit:=E{Yt=ei}| FSt. 然后,我们可以将滤波器表示为πt(f)=KXi=1fiπit=hf,πti,0≤ T≤ T、 本节的目的是推导过程π=(π,…,πK)的动力学。为此,我们首先观察到,根据Kallianpur-Striebel公式,我们得到πt(f):=pt(f)pt(1)表示所有t∈ [0,T],其中p(f)表示过滤器的非规范化版本,由pt(f)定义:=等式eZthf,Yti | FSt, 0≤ T≤ T、 (3.2)p(f)的动力学在下一个定理中给出。定理3.2(Zakai方程)。假设假设2.1成立,让f:E→ R、 那么,不管怎样∈ [0,T],非正规化滤波器(3.2)求解方程:pt(f)=π(f)+Ztps(Qf)ds+ZtZRps-(β(z)f)(uR(ds,dz)- ηQs(dz)ds),(3.3),其中pt-(β(z)f)=等式f(Yt-)eZt公司-β(t,Yt-, νt-, z) | FSt和pt(Qf)=等式eZthQf,Yti | FSt.我们现在提供了证明的总体思路,详细信息见附录A。请考虑(3.1)中定义的过程和一些函数f:E→ R、 然后根据It^o的公式,乘积eztf(Yt)具有以下(Q,F)-半鞅分解eztf(Yt)=F(Y)+ZteZshQf,Ytids+ZteZsdMfs+ZteZsf(Ys)ZRβ(s,Ys-, νs-, z)uR(ds,dz)- ηQs(dz)ds,其中Mf=(Mf)0≤T≤这是F(Y)的半鞅分解中出现的真(F,Q)-鞅。将关于FStyields的条件期望作为结果,因为它可以显示:RteZsdMfs | FSt= 我们引入符号πt-(ηP(dz)):=KXi=1πit-ηP(t,ei,νt,dz),0≤ T≤ T、 通过应用[11,Ch.II,定理T14],很容易看出πT-(ηP(dz))dt给出度量uR的(FS,P)-双可预测投影。
|