统计软件包SPSS给统计工作者提供了很大方便,SPSS for Windows版本推出后,使用者无需编写程序也可完成分析,使用更广泛了。然而,面对软件包提供的众多统计过程(或方法),有些使用者感到迷惘。针对这种情况,本文就如何正确使用SPSS for Windows软件包中Nonparametric Tests过程清单提供的8个非参数检验过程(或方法)逐一介绍。
一、Chi-Square
Chi-Square是对单个样本作检验的推断方法,用于推断目前掌握的样本是否来自某特定分布总体,属拟合优度检验〔1〕。要求提供假定总体的理论频数;默认总体为均匀分布时无需提供理论频数〔2〕。Chi-Square过程通过分析实际频数与理论频数吻合的程序来完成检验,因此特别适合于频数资料的分析,也只接受和处理频数资料,如病人经治疗后治愈、好转、有效和无效的人数总的说来是否相同(实为治愈、好转、有效和无效的概率或机会是否相同),成绩优、良、中、差的学生人数总的说来是否相同,赞同某种观点的人数总的说来是否达到80%,等等。要求样本足够大,按观察值从小到大的顺序提供理论频数。理论频数通过主对话框中Expected Values的Values选项提供,All categories equal是默认项,即均匀分布。若只想推断样本中某一范围内的频数是否来自某种特定分布总体,可通过主对话框中Expected Range的Use speciffied range选项提供范围的上、下限。上述理论频数需根据假定总体分布计算或问题的实际背景确定。
二、Binomial
Binomial过程对二值变量的单个样本作检验,推断总体中两类个体的比例是否分别为π和(1-π),π值通过Test Proportion选项提供,默认值是π=0.5〔2〕。可借助于主对话框中Define Dichotomy的Cut point选项提供截断点,将连续变量转化成二值变量作分析;若提供的变量已经是二值变量,则不需提供截断点。小样本时输出精确概率,大样本时输出正态近似法的结果。显然,在大样本时,也可用Chi-Square过程完成。
三、Runs
Runs过程借助样本序列的顺序推断总体序列的顺序是否是随机的,属随机性检验〔3,4〕。过程将变量转化成二值变量后再作检验,转化时所用截断点可以是Median、Mode、Mean或指定的数值,需通过Cut Point对话框指明截断点。结果中只输出正态近似法的P值,因此要求样本足够大,样本不大时应利用结果提供的信息查表作结论,不可直接用结果中的P值作结论。Runs检验的基本思想也用于分析两个独立样本数据,推断两个总体的分布是否相同〔4〕,称Wald-Wolfowitz runs检验,见后文。
四、1-Sample K-S
1-Sample K-S过程也是对单个样本作分析,推断样本是否来自正态分布总体、或均匀分布总体、或Poisson分布总体,也属拟合优度检验。此方法是前苏联学者于本世纪三十年代提出的,称为“Kolmogorov-smirnov”单一样本检验,又称Kolmogorov检验,K-S是Kolmogorov-Smirnov的缩写。此过程直接处理原始数据,一般认为其功效比Chi-Square检验高,且在样本不大时也可用〔3〕。结果中的Z是渐近统计量〔5〕,大样本时α=0.05和α=0.01的界值分别是1.36和1.63,小样本时应读取结果中经验分布函数与理论分布函数的最大差值查界值表作结论,不可直接利用结果中的P值作结论。此方法的基本思想还可用于推断两个独立样本是否来自相同的总体,详见下文。
五、2 Independent Samples
此过程用于推断两个独立样本是否来自相同的总体,有四种方法供选用,各方法间不全相同,现逐一介绍如下。
1.Mann-Whitney U检验(又简称M-W检验),注重对分布的中心位置(平均水平)作检验,实际是检验H0:两样本所对应的总体具有相同的中心位置(中位数),属位置参数检验,而不管两总体分布的形状如何,因此通常假定两总体分布的形状相同〔3〕,只有在这个前提下的中心位置相同才能说是两总体分布相同或两样本来自相同总体;若不能明确两总体分布的形状是否相同,则不宜单独使用此方法作分析了事,应同时作K-S检验或W-W检验,并对全部结果作综合分析。因为此方法与目前国内通用教材中的Wilcoxon Rank Sum检验法完全等价,故在结果中一并给出〔1〕。小样本时应读取精确概率作结论〔6〕。
2.Kolmogorov-Smirnov Z检验(又简称K-S检验)是上述提到的Kolmogorov检验用于两个独立样本的情形,对全貌作检验。如果结论是两总体分布不相同,此方法尚不足以说明是位置不同、变异程度不同还是偏度不同,这是报告结果时应注意的。结果中的Z也是渐近统计量,大样本时α=0.05和α=0.01的界值分别是1.36和1.63,小样本时应读取结果中两个经验分布函数的最大差值查界值表作结论,不可直接利用结果中的P值作结论。
3.Wald-Wolfowitz runs检验 (又简称W-W检验)与K-S检验相似,也是对全貌作检验,但其功效不如后者;此方法实为Runs过程用于分析两个独立样本的情形。与K-S检验类似,如果结论是两总体分布不相同,此方法尚不足以说明是位置不同、变异程度不同还是偏度不同,报告结果时也应注意。若两样本有相同观察值,结果中提供最大和最小游程个数以及相应的P值,当依此两P值所作的结论相矛盾时,须计算平均游程个数,然后查表作结论或用正态近似法作检验。此过程自动地根据样本大小给出确切概率或正态近似法的结果。
4.Moses Test of Extreme Reactions 检验注重于对分布范围(变异程度)作检验,实际是检验H0:两样本所对应的总体具有相同的分布范围〔1〕。要求样本足够大。笔者尚未见到在医学领域中使用此方法的例子。
六、K Independent Samples
此过程用于推断多个独立样本是否来自相同的总体,有两种方法供选用。
1.Kroskal-Wallis H检验的是H0:多个样本对应的总体具有相同的中位数,属位置参数检验,是Mann-Whitney U检验的延伸。通常也假定两总体分布的形状相同。此方法就是目前国内通用教材中的多个样本比较的秩和检验(H检验)。
2.Median检验的H0与Kroskal-Wallis H检验相同,但通常情况下其功效不如后者;然而,在相同值很多时效果较好,此时使用者应选用Median检验〔1〕。
七、2 Related Samples
此过程用于推断两个相关样本是否来自相同的总体,有三种方法供选用。
1.Wilcoxon检验属对称性检验,检验差值总体的对称中心是否为0,从而推断两样本是否来自中心位置相同的总体。这就是目前国内通用教材中的配对设计资料的符号秩和检验,使用者大多熟悉,不多赘述。应该注意的是,小样本时不可直接读取结果中的P值作结论,而应利用结果中的秩和统计量查表作结论〔6〕。
2.Sign检验也属对称性检验,相比于Wilcoxon检验,此方法不考虑“+”或“-”差值的相对大小关系(即秩次),只检验差值总体中“+”与“-”的个数是否相同,从而推断两样本是否来自中心位置相同的总体〔1,4〕。小样本时采用二项分布计算精确概率,大样本时采用正态近似法作检验。通常在数据测量较粗糙、不精确时使用。效率不如Wilcoxon检验。若变量是二值的,其检验效果与McNemar检验完全相同。
3.McNemar检验实为目前国内通用教材中关于配对四格表资料有无差别的b、c格比较的检验,因此只接受和处理二值变量。小样本时采用二项分布计算精确概率,大样本时采用大家熟悉的χ2检验。此时作Sign检验也可得到相同结果。
对于两个相关样本数据,目前国内通用教材中大多有介绍Spearman相关系数rs的计算方法及其假设检验,SPSS将此分析方法与Pearson相关系数r的分析、Kendall相关系数τ的分析归到一类,统一的Correlate过程中〔2〕,其中τ和rs的分析用在检验独立性时是渐近等价的,在大样本时可认为是等价的〔7〕。
八、K Related Samples
此过程用于分析多个相关样本数据,以推断它们是否来自分布相同的总体。有三种方法供选用,现分别叙述如下。
1.Friedman检验就是目前国内通用教材中关于随机区组设计资料的秩和检验。使用者大多熟悉,不加赘述。
2.Kendall’s W检验,是和谐性分析,W统计量称和谐性系数或一致性系数(coefficient of concordance),用于度量一致性好坏。对同一份数据作分析,Kendall’s W检验拒绝H0与否和Friedman检验完全相同,但它们所检验的H0不相同〔7〕。如:N名教师同时对K名学生的作文评分,对这份样本数据同时作Friedman检验和Kendall’s W检验,两个检验的无效假设分别是“H0:这K名学生的作文水平相同”和“H0:教师不都认为某位学生作文水平比别的学生高或低(即教师的评分有高有低,不和谐、没有一致性)”。可见,Kendall’ W检验和Friedman检验既有联系又有区别,应根据要解决的问题正确使用,不应随意使用。
3.Cochran’s Q检验是McNemar法的推广,也只适用于二分变量数据。如:一批标本同时接种到4种培养基,根据病菌生长情况(有无生长,是二值变量)评价这4种培养基培养的效果是否相同,此时需用Cochran’s Q方法作分析〔8〕。要求样本足够大,其中Q统计量服从自由度为v=k-1的χ2分布,k是处理组数(如上述例子中的培养基种类数4)。