|
(20) 我们可以将H(Y | X)解释为给定X实现的Y的不确定性。转移熵可以定义为条件熵之间的差异:te(X→ Y)=T EXP,YFYP= HYFYP- HYFXP,YP, (21)可以重写为香农熵之和:te(X→ Y)=HYP,XP- HYF,YP,XP+ HYF,YP- HYP, (22)式中,yf是滞后时Y的向前时移版本相对于同时代的乌斯泰系列XP和YP。硅。B.2核密度估计在熵计算中,必须估计经验概率分布。基于组织学的方法和核密度估计是两种主要的方法。HistorogramBased是最简单和最常用的非参数密度估计器。尽管如此,它产生的密度估计值具有不连续性,并且根据垃圾箱的尺寸选择而显著不同。核密度估计(KDE)方法也称为Parzen-Rosenblatt窗方法,它使用相邻观测值来近似x点的密度函数。然而,KDE方法没有像直方图那样根据料仓边缘建立估计,而是使用估计x的每个点作为宽度为2h的料仓的中心,并根据核函数对其进行加权。因此,概率密度函数f(x)的核估计被定义为^f=nhXx∈XK十、- xh. (23)我们在这里使用的核K的一个常见选择是(高斯)径向基函数:K(x)=√2πexp-x、 (24)等式(23)中带宽h的选择问题在密度估计中至关重要。较大的h会过度平滑估计的密度,并掩盖数据的结构。另一方面,较小的带宽将减少密度估计的偏差,而代价是估计中的较大方差。
|