方差分析(analysis of variance,ANOVA)是在多个总体或者组(group)之间进行比较的方法。在方差分析中,从每个组中选取样本来检验两个或更多组中差异的影响。分组的条件被称为因素(factor),有时也称兴趣因素。构成因素的不同水平(level)类似于属性变量下包括的类别。
在最简单的单因素方差分析(one-way ANOVA,又称为完全随机设计)中,只检验一种因素,构成因素的不同水平称为变量分组的基础。单因素方差分析是一个包括两部分的过程。首先确定各组平均值之间是否有显著性差异。如果拒绝了零假设代表的各组平均值之间没有差别,那么再以第二种方法继续寻找哪些组的平均值明显的不同于其他组的平均值。
oneway x1 x2 //x2因素作用下的不同水平,x1变量在每组中有相对应的数值,执行后可以得到ANOVA的分析结果
/*df是自由度 degree of freedom
SS:离均差平方和 也就是变量中每个数据点与变量均值差的平方和
MS: mean square =SS/DF
F 值 = 组间差异 /组内差异 处理的MS/误差的MS MSA/MSW
造成波动的原因可分成两类,,一是不可控的随机因素:误差的MS-MSA,另一是研究中施加的对结果形成影响的可控因素处理的MS-MSW。
看F的p值 p远小于<0.05说明至少有两个组是有显著差别的
最后一行是方差齐性检验(test for equal variances),p值>0.05说明满足方差齐性*/
oneway x1 x2, bonferroni//如果至少两个组显著有差别,用bonferroni检验两两比较是哪两个组
//在结果中两两比较组之间的p如果<0.05,则说明有显著差异,正负号说明是显著大还是小于另一个
oneway x1 x2, bonferroni tabulate // 看每组详细的频数统计表格
codebook x1 x2//查看每个变量描述性统计信息内容
要使用单因素方差分析F检验,你必须对所要考察的数据作出三个假设:
样本选择的随机性与独立性(randomness and independence)
样本来源的c个组的正态性(normality)
同方差(homegeneity of variance)(c个组的方差相同)
如果每组中都有相同大小的样本容量,在F分布基础上推断就不会被异方差问题严重影响。可以使用同方差Levene检验来检验c个组的方差是否相等。
有许多方法可以用来确定c个均值的哪些是显著不同的,一个最常用的方法是单因素方差分析Tukey-Kramer多重比较过程(Tukey-Kramer multiple comparisons procedure for one-way ANOVA)


雷达卡


京公网安备 11010802022788号







