|
在这个层次上,大小更为多变,在小样本中往往过高;特别是,在最小样本的情况下,单侧LRT(巴塞尔例外测试)的尺寸很小。分数测试似乎再次具有最佳的规模属性。在这种情况下,测试更强大,因为四个模型的分位数之间存在更明显的差异。由于非正态模型与正态模型相比产生了太多的异常,因此单侧测试比双侧测试更有效。分数测试和LRT似乎比Waldtest更强大一些。只有在最大样本(1000和2000)和最长右尾分布(倾斜t3)的情况下,我们才能获得高功率(绿色电池)。3.1.3多项试验结果结果如表3所示,并以图形方式显示在图1中。请注意,如第2.3节所述,N=1的Pearson检验给出的结果与表2中的双侧得分检验相同。在N=1的情况下,Nass统计量与Pearson统计量的值非常接近,也给出了大致相同的结果。N=1的轻轨是表2中的双面轻轨。测试的大小。表3的第一个面板中总结了三个测试的大小结果,其中G为正常值,图1的第一行图片中总结了这三个测试的大小结果。可以提出以下几点:N的Pearsonχ检验的大小迅速恶化≥ 8表明睾丸对箱子大小非常敏感Nass测试具有最佳的尺寸特性,对于所有N和所有样本尺寸的选择都非常稳定。与其他测试相比,2的尺寸始终小于或等于5%≤ N≤ 8.当N超过8时,尺寸有轻微增加5%以上的趋势在尺寸n=250的最小样本中,轻轨的尺寸过大,但在其他情况下,对于n的所有选择,轻轨的尺寸都是合理的。
|