方差分析是基于样本方差对总体均值进行统计推断的方法,它是通过实验观察某一种或多种因素的变化对实验结果是否带来显著影响,进而鉴别各种因素的效应,从而选取一种最优方案。包括单因素方差分析、多因素方差分析和协方差分析。
一、t检验t检验是用于小样本(样本容量小于30)两个平均值差异程度的检验方法。
它是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。t检验包括单样本t检验、两样本t检验,其中两样本t检验又包括配对样本t检验和两独立样本t检验。
1、 单样本t检验的Stata操作
单样本t检验有两种用法。
其一:检验样本平均数是否显著地不同于某个假设值。
其二:检验同一套观察值中的两个变量的统计指标是否显著地不同。这等价于两者的差值的平均数是否等于零。
l ttest cq=90 //检验样本均值是否为90
l ttest cq=90,level(90) //在置信度为90%的水平下,检验样本均值是否为90
l ttest cq=ch //检验变量cq和ch的均值是否相等
l ttest wage,by(gender) //检验工资是否会因性别不同而存在差异
l ttest wage,by(gender) unequal //在不假定方差相同的情况下,检验工资是否因性别不同而存在差异
二、单因素方差分析单因素方差分析用于比较多组样本的均数是否相同,并假定:每组的数据服从正态分布,具有相同的方差,且相互独立。
l oneway drink employed,tabulate scheffe //其中tabulate可以产生方差分析表,以及平均数和标准差表。Scheffe选项生成了一个表来显示在每一对平均数之间的差异。
三、单因素方差分析多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产生显著影响。这里,由于研究多个因素对观测变量的影响,因此称为多因素方差分析。若研究的是两个变量,则称为双因素方差分析。
多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。
l anova salary gender minority gender#minority //检验薪水的差异是否因性别差异、民族差异或者两者的交互效应而造成的。
四、协方差分析不论是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定。但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响。
协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价。
协方差分析拓展了多因素方差分析,使之可以包含分类变量和连续变量的情况。当出现连续变量时,定义此变量,方差分析便可进行。Anova具有处理连续变量和分类变量的能力。
l anova salary gender minority gender#minority c.beginsalary //检验薪水水平的差异是否由性别、民族、性别与民族的交互影响、以及起始薪水的差异所引起。
l regress salary gender minority gender#minority c.beginsalary //做薪水关于性别、民族、性别与民族的交互影响、以及起始薪水的回归方程。