|
(20) 我们可以将H(Y | X)解释为给定X实现的Y的不确定性。传递熵可以定义为条件熵之间的差异:T E(X→ Y)=T EXP,YFYP公司= HYF公司YP公司- HYF公司XP,YP, (21)可以重写为香农熵之和:T E(X→ Y)=HYP,XP- HYF、YP、XP+ HYF,YP- HYP公司, (22)其中yf是滞后时Y的前向时移版本t相对于同期的乌斯汀系列xp和YP。硅。B、 2核密度估计在熵计算中,必须估计经验概率分布。基于组织学的方法和核密度估计是这方面的两种主要方法。Histogrambased是最简单和最常用的非参数密度估计。尽管如此,它产生的密度估计值具有不连续性,并且根据垃圾箱的尺寸选择而显著变化。核密度估计(KDE)方法也称为Parzen-Rosenblatt窗方法,它使用相邻观测值来近似x点的密度函数。然而,KDE方法没有像直方图那样根据料仓边缘建立估计值,而是使用估计值x的每个点作为宽度为2h的料仓的中心,并根据核函数对其进行加权。因此,概率密度函数f(x)的核估计被定义为^f=nhXx∈XK公司x个- xh公司. (23)我们在这里使用的核K的一个常见选择是(高斯)径向基函数:K(x)=√2πexp-x、 (24)在方程(23)中选择带宽h的问题在密度估计中至关重要。较大的h将过度平滑估计的密度并掩盖数据的结构。另一方面,较小的带宽将减少密度估计值的偏差,而代价是估计值的方差更大。
|