|
另一个可能非常有用的信息是Fisher指数,该指数由比值γ=E[(X)定义,可以改善SN及其极限分布的近似分布- E(X))](var(X)),这是峰度指数。偏度E[(X-E(X))]/(var(X))X和(γ的3/2-3) 测量cdf与Φ的接近度。因此,我们将根据Tk和的第四个矩(即第一个n)的存在条件来选择k- k orderstatistics)注意以下涉及埃尔米特多项式(Hn,n)的Edgeworth展开式≥0)指出,要求第四阶矩的完整性似乎是我们所说的“最优”解(当然,高阶矩存在,正规近似值越高,但这意味着条件太强,难以处理)。如果Fn表示标准化SNN的cdf- nE(X)pn var(X),然后fn(X)- Φ(x)=√nQ(x)+nQ(x)+o(1/n)(16)在x中均匀分布,其中q(x)=-~n(x)H(x)E[(x)- E(X))](var(X))3/2Q(X)=-~n(x)nH(x)E[(X)- E(X))](var(X))+H(X)γ - 3.oandH(x)=x- 1.H(x)=x- 3倍;H(x)=x- 10x+15x收敛速度明显为n-δ/2e[X2+δ]<∞, δ > 0.注意,在我们的帕累托情形中,偏斜度γ:=E[(X-E(X))](var(X))3/2和过剩峰度γ:=γ- 3=E[(X)-E(X))](var(X))- 3分别为γ=2(1+α)α-3qα-2α如果α>3γ=6(α+α-6α-2)α(α-3)(α-4) 如果α>4,那么我们设置p=4(但更倾向于保留符号p,使其保持通用),以获得我们所称的“最佳”近似值。然后我们选择阈值k=k(α),使得e(Xp(j))< ∞ J≤ N- k=∞ j>n- k(17)适用于我们的α-Pareto iid rv的情况,使用(6)给出:k>pα- 1(18)该条件允许确定一个固定的数字k=k(α),作为Xi的潜在重尾分布的形状参数α的函数,而不是样本的大小n。
|