|
我们说,如果在EM算法下α6=β(不在对角线上),且qαβ不收敛到零,则允许对α,β。对于实际应用,可以将允许值的集合想象为α、β的集合,例如qαβ>, 哪里 是某个分界点(10-8,比如说)。我们必须排除小参数的原因是,这种分析只适用于大数据限制,因为我们没有有限的数据量,我们无法排除某些跳跃,但是,如果qαβ收敛到零,这意味着该参数要么为零,要么极为接近零,因此我们可以在上面用一个较小的数字将其绑定。此外,从数学角度来看,一个趋向于零(甚至变为零)的参数位于边界上,这里的可微性概念并不明确。因此,在受限参数空间中解决问题时,我们可以将“允许对”视为变量。我们现在给出以下定理。定理2.14。Letu,ν,α,β∈ {1,…,h},和Q,Qbe两个生成矩阵(∈ ∧对一些人来说 > 0)。对于任意两个允许的对α、β和u、ν,(2.11)中的导数为,R(Q;Q)qαβquν=n-1Xs=1quν-(等式(ts+1-ts))-2ys,ys+1eC(αβ)η(ts+1-ts)ys,h+ys+1(eC(uν)γ(ts+1-ts)ys,h+ys+1+(等式(ts+1-ts))-1ys,ys+1eC(αβ,uν)ψ(ts+1-ts)ys,3h+ys+1--(等式(ts+1-ts))-2ys,ys+1eC(αβ)η(ts+1-ts)ys,h+ys+1(eC(u)φ(ts+1-ts)ys,h+ys+1+(等式(ts+1-ts))-1ys,ys+1eC(αβ,u)ω(ts+1-ts)ys,3h+ys+1,式中,2h×2h矩阵C(αβ)γ、C(α)φ、C(αβ)η定义为C(αβ)γ=Q Qαβeαe |β0 Q, C(α)φ=Q eαe |α0 Q, C(αβ)η=Q eαe |β- eαe |α0 Q,4h×4h矩阵C(αβ,uν)ψ,C(αβ,u)ω定义为C(αβ,uν)ψ=C(uν)γC(uν)γqαβ0 C(uν)γ, C(αβ,u)ω=C(u)φC(u)φqαβ0 C(u)φ.这一证明使用了与命题2.4类似的技术以及矩阵指数的微分性质,并推迟到附录A.2。备注2.15。
|