一。基于重标极差(R/S)分析方法基础上的赫斯特指数(H)的研究是由英国水文专家H.E.Hurst(1900—1978)在研究尼罗河水库水流量和贮存能力的关系时,发现用有偏的随机游走(分形布朗运动)能够更好地描述水库的长期存贮能力,并在此基础上提出了用重标极差(R/S)分析方法来建立赫斯特指数(H)。作为判断时间序列数据遵从随机游走还是有偏的随机游走过程的指标。
赫斯特指数 概述
洪水过程是时间系列曲线,具有正的长时间相关效应。即干旱愈久,就可能出现持续的干旱;大洪水年过后仍然会有较大洪水。这种特性可以用赫斯特指数来表示。
对局域网和广域网上大量突发网络流量的分析结果表明,网络流量普遍存在着自相似性和长相关性,其中赫斯特指数是表征网络流量突发性的重要参数。以小波提升框架为基础,结合相关系数分析法,给出了自适应的赫斯特指数估计方法,与传统的小波估计法相比,该法执行原位计算,使计算复杂性减少了约一半,同时该方法在一般意义上是无偏的。分形高斯噪声和真实突发网络数据的仿真结果均表明,自适应方法比传统估计方法具有更高的估计精度,能够自适应地选择最优尺度区间,因此可望应用于高速网络的网络管理和实时控制。
赫斯特指数 计算
赫斯特指数的思路是:设Xi=X1,…Xn为一时间序列的n个连续值,取对数并进行一次差分后的数据划分为长度为H的相邻的子区间A,即A*H=n。则:每个子区间的均值为: Xm=(X1+…+Xh)/H 标准差为:
二。而关联维数不仅是我们在相空间重构过程中求解嵌入维数的一种重要方法,而且在机械故障诊断中发挥了重要的作用。
关联维数计算的方法目前最主要的就是GP算法了,虽然目前也提出来一些其他的方法,但大都是基于GP算法的改进,譬如在GP算法前加入迭代奇异值降噪,减少噪声的影响,用小波变换方法计算关联维数,逐步迭代方法计算关联维数等等。我这里还是以GP算法为主要的介绍目标。分为几个内容:理论基础、GP算法求解步骤、程序中的参数理解和设置。
1 GP算法理论基础
设点X1,X2,...,XN为相空间内吸引子上的点,用Br(Xi)表示以参考点Xi为中心、半径为r的球形盒子,盒子的形状对维数的计算不会产生影响,盒子Br(Xi)的概率测度见图中的公式(1)
由此可得关联维数的定义式(2)。
由式(5)可知,当r->0时,关联积分C(r)和r之间存在标度关系,因此做出LnC(r)对Lnr的变化图,曲线斜率k即为关联维数D2。
2 GP算法的计算步骤
(1)利用时间序列X1,X2,...,XN,先给定一个较小的嵌入维数m0,重构相空间,得到新的序列{Yi}
(2)计算关联积分C(r)
(3)对于r的某个取值范围,吸引子的维数d与累积分布函数C(r)应满足对数线性关系,即d(m)=LnC(r)/Lnr,从而可用最小二乘拟合得到对应于m0的关联维数估计d(m0)
(4)增加嵌入维数m0,重新计算步骤(2)和(3),知道相应的维数估计值d(m)不再随着m的增加而在一定误差范围内不变为止。
――――以上参考自吕金虎《混沌时间序列及其应用》
3 参数选取
一般计算过程中,可选定时间延迟、嵌入维数,做出LnC(r)~Lnr的曲线,选取线性度较好的一段作线性拟合,计算出拟合直线的斜率值,即得到关联维数。
(1)时间延迟――可根据自相关方法、CC方法计算得到
(2)嵌入维数,可先选定一个较小区域的m,看计算结果而定,如果曲线收敛较好,则进行拟合求得关联维数,如果不行,则继续定义m的区域
(3)r的取值,这个取值应限定在重构相空间中各点间最小距离与最大距离之间,即dmin<r<dmax,这点在GP程序中已有体现,那么程序中输入的ss是什么呢?这个ss其实就是r的序列的长度,一般来说,r的长度不能少于20。
r的取值有好几种方法:等比例取值、等间距取值、等指数比例取值等等,在程序中就是最简单的等距离取值。
(4)序列长度N,不能太少,一般要求N>=1500
|