|
最大似然法(Paninski(2003))也已成功应用。在下文中,我们将重点讨论假设随机变量的离散共域或已“离散化”的域的估计方法。给定时间序列中值的离散化(例如返回序列、下降序列)是将随机变量X的连续值映射到通过划分X的支持度而得到的离散集。这些离散化值通常被称为“字母”或符号。然后用有限和近似熵:H(X)≈^Hbinned(X)=-Xi^p(X∈ i) ·对数(^p(X∈ i) )式中^p(X∈ i) 表示具有以下值的随机变量的估计概率:i、 随着分区的大小越来越小,^Hbinned(X)收敛到H(X)以获得性能良好的分布(有关讨论,请参阅Grassberger(2003))。文献中介绍了对离散数据进行分区的不同方法。在某些情况下,分区是通过将分布划分为相等的部分来形成的,为定义的每个符号产生相等的边际概率。Marschinski和Kantz(2002)选择了这样的划分方案,以避免由于直方图非常不均匀而产生的“不良”影响。作为等边际概率离散化的一个示例,考虑一个返回序列{r,…rn},其中c的分位数为q(rt,c∈ (0, 1). 以下将所有返回映射为三个符号,这取决于返回是否低于、介于或高于33%和66%分位数,形成一个等概率装箱方案:dr(rt)=如果rt<q(rt,0.33),则为0;如果q(rt,0.33),则为1≤ rt公司≤ q(rt,0.66)2如果rt>q(rt,0.66)(2.16),参见Hlavackova Schindler、Palus和Vejmelka(2007)。其他作者更喜欢不等边际概率划分方案。
|