4.1假设检验
假设检验(hypothesistesting):通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异,这种推论过程被称作假设检验。假设检验包括了参数检验和非参数检验
参数假设检验(parametrictest):当总体分布形式已知,通过样本数据对总体分布的未知参数进行推断,这种推断方法称为参数假设检验。
非参数假设检验(non-parametrictest):当对总体分布形式不了解,根据样本数据对总体的分布形式及其他特征进行推断,通常称之为非参数假设检验。
4.1假设检验
假设检验的基本步骤
步骤1:提出原假设H0
步骤2:确定检验统计量
步骤3:计算检验统计量及发生的概率p值
步骤4:设定显著性水平a并与概率p值进行比较,做出统计决策。 (一般没有特殊说明的情况下,以显著性水平a=0.05进行分析说明)当p>α时,接受原假设;当p<α 时,拒绝原假设。
4.2.1单样本t检验概述单样本t检验:其研究的是样本均值与总体均值的差异问题,目的在于推断样本的总体均值是否与某个指定的检验值存在统计学上的显著性差异。
单样本t检验只研究一个样本的问题;另一方面是因为其进行假设检验所依据的分布主要是t分布,所以称为“t检验”。
使用前提:①单个样本数据;②样本来自的总体要服从或近似服从正态分布;③样本数据为连续性数据
4.2.2单样本t检验的基本步骤
步骤1:建立原假设H0。原假设H0根据不同的情况分为以下三种方式:H0: m= m0;H1: m¹m0 (双侧检验);
H0: m≤m0;H1: m>m0(单侧检验或右侧检验);
H0: m≥m0;H1: m<m0(单侧检验或左侧检验)。
4.2.3单样本t检验的基本操作及应用案例4-1
为了了解某市民间信贷的发展情况,相关部门随机抽取了该市某年30家信贷公司的贷款年利率,已知该市所属省份信贷公司的贷款年平均利率为16%,试利用数据“贷款利率.sav”分析该市信贷利率是否和其所属省份的贷款利率一致。
4.2单样本t检验
案例分析:
(1)该数据只涉及到一个样本,要比较的是该样本与已知总体均值的差异,因此可以选择单样本t检验进行分析。
(2)建立原假设:总体均值(μ)与检验值(μ0)之间不存在显著差异,(贷款年平均利率为16%),根据设问来建立原假设H0:μ=μ0= 16%
4.2单样本t检验
步骤1:打开数据见本章数据“贷款利率.sav
贷款利率.rar
(461 Bytes, 需要: 2 个论坛币)
本附件包括:
步骤2:
数据录入后,依次选择【分析】→【比较均值】→【单样本T检验】命令,如右图所示。
4.2单样本t检验
步骤3:
单击【单样本T检验】进入其对话框,把“年利率”添加到右侧【检验变量】框中,在【检验值】文本框中输入16,如右图所示,其他选项保持系统默认状态。最后单击【确定】按钮,提交系统分析。
4.2单样本t检验
步骤4:结果解释。
由下表可知,t统计量为1.364,自由度df=29(n-1=30-1),“Sig.(双侧)”表示进行的是双侧检验,这里t的显著性检验p值为0.183,即p=0.183>0.05,所以接受原假设H0,即认为该市信贷公司贷款利率和该省的贷款利率没有显著性区别。如果p<0.05,则拒绝原假设H0,认为两者存在显著性差异。
4.2单样本t检验
案例4-2
在上例案例4-1中,假设当年该地区银行的贷款利率为6%,试检验该市信贷公司的贷款利率和该地区银行的贷款利率是否有显著性差异。
案例分析:
(1)案例4-2与案例4-1类似,该数据只涉及到一个样本,可以采用单样本t检验进行分析。
(2)建立原假设H0:μ=μ0= 6%
4.2单样本t检验
因为案例4-2与案例4-1操作步骤相似,这里仅提供与上例不同的步骤与结果解释加以分析。
在选择“检验值”时,这时需要填的是“6”,如右图所示,其他步骤和上例相同,在此省略。
4.2单样本t检验
结果解释:
从下表可以看出,检验统计量t=21.529,df=29,p=0.000<0.05,说明该市信贷利率和本地区银行利率有显著性的差异,从上表可知样本均值为16.6767%,而本地区银行利率为6%,说明该市信贷利率要显著高于本地区银行利率。
4.3.1两独立样本t检验概述
两独立样本t检验:利用来自两个总体的独立样本的差异情况,推断两个总体的均值间是否存在显著差异。
两独立样本t检验的前提:1.样本来自的总体应服从或近似服从正态分布。2.两样本相互独立,即从一总体中抽取一组样本对从另一总体中抽取一组样本没有任何影响,两组样本的个案数目可以不等。3.样本数据为连续性变量。
4.3两独立样本t检验
4.3.2两独立样本t检验的基本步骤
步骤1:建立原假设H0。
与单样本t检验一样,两独立样本t检验的原假设H0也有以下三种情况:
H0:m1 = m2;H1: m1≠m2(双侧检验)
H0:m1≤m2;H1: m1>m2(单侧检验或右侧检验);
H0:m1≥m2;H1: m1<m2(单侧检验或左侧检验)。
其中,m1和m2分别是第一个和第二个总体的均值。
4.3两独立样本t检验两独立样本t检验的决策比单样本t检验多一个步骤,分以下两步进行。
(1)判断两独立样本方差是否相等。(F检验)
原假设H0为两总体方差没有显著差异,表述为H0:σ1 =σ2;①若F检验统计量对应的概率p>a时,接受原假设H0,结论即为两总体方差相等。②若F检验统计量对应的概率p<a时,拒绝原假设H0,结论即为两总体方差不相等。
(2)判断两独立样本的总体均值是否有差异。(t检验)
根据F检验的结果,来进行t检验。
4.3两独立样本t检验
案例4-3
为研究分析ST公司与非ST公司净利润是否存在显著差异,交易所随机抽查了30家ST和非ST公司,收集了他们的相关数据,请利用本章数据“ST和非ST公司.sav”,试分析两者净利润是否存在显著性差异。
案例分析:该数据包括了ST公司与非ST公司两个样本的数据,题目想研究两个样本背后的总体是否有显著性的差距,因为这两类公司是相互独立的,因此可用两独立样本t检验进行分析。
4.3两独立样本t检验
步骤1:打开本章数据“ST和非ST公司.sav
ST与非ST公司.rar
(609 Bytes, 需要: 2 个论坛币)
本附件包括:
步骤2:
数据录入后,依次选择【分析】→【比较均值】→【独立样本T检验】命令,如右图所示。
4.3两独立样本t检验
步骤3:
单击【独立样本T检验】进入【独立样本T检验】对话框。以“净利润”为检验变量,“ST类型”为分组变量,所以分别把“净利润”添加到【检验变量】框中,把“ST类型”添加到【分组变量】框中,如图所示。
单击【定义组】按钮,出现如图4-10所示的对话框,在【使用指定值】下输入之前定义“ST类型”的数值,“0”表示“非ST公司”,“1”表示“ST公司”,所以分别输入“0”和“1”,如果依次输入的是“1”和“0”也是可以的,只不过在输出结果部分这两种方式的t统计量一个为正值,另一个为负值而已,但是它们的绝对值相等,所得结论也是一样的。接下来单击【继续】按钮回到主界面,其他选项默认,最后单击【确定】按钮,提交系统分析。
步骤4:结果解释。
右表是基本描述统计量分析,可以看出ST公司利润均值为-2 233.096 7万元,标准差为3 766.591 72万元,而非ST公司净利润的样本均值为7 830.886 7万元,标准差为7 778.358 02万元,还包括两者的样本量和均值的标准误。我们需要用这些信息验证两个样本各自的总体是否有差异,因此还需利用表4-8进行分析,分以下两步进行。
(1)判断两者方差是否相等。利用F检验判断两总体方差是否相等,F检验统计量为8.295,F检验所对应的概率p值为0.008,p=0.008<a=0.05时,拒绝原假设H0,即可以认为ST公司与非ST公司净利润的方差不相等。
(2)判断两总体均值是否有差异。前面已经证明ST公司与非ST公司净利润的方差不相等,这时选择“假设方差不相等”那一行的数据进行两独立样本t检验;如果遇到两样本方差相等的情况,则选择第一行的数据进行分析。此时可以看出,t=4.510,p=0.000<a=0.05时,拒绝原假设H0,因此,可以认为ST公司与非ST公司净利润均值有显著差异。
t检验在这里是双侧检验,只能告诉我们两总体是否有差异,如果想要判断两总体均值孰高孰低,这时可以参考表4-7中的均值,表4-7显示ST公司的净利润为7 830.886 7,而非ST公司的净利润为-2 233.096 7,由此可以判断ST公司的净利润要显著高于非ST公司的。4.4两配对样本t检验
4.4.1两配对样本t检验的研究目的目的:利用来自两个总体的配对样本,推断两个总体的均值是否存在显著差异。
配对样本t检验与独立样本t检验的区别之一是:配对样本t检验要求样本是配对的。
所谓配对样本:(1)个案在“前”“后”两种状态下的某属性的两种状态。
(2)是对某事物两个不同侧面或方面的描述,抽样不是相互独立的,而是相互关联的。
4.4两配对样本t检验
配对样本举例:
“分析减肥茶的效果”—喝减肥茶前的体重,喝减肥茶后的体重
“分析两种不同促销手段下商品的销售额的变化”
配对样本t检验的适用条件:
①两组样本有一定的关联,两组样本的样本容量应该相等,它们观察值的顺序一一对应,不能随意改变;
②样本来自的总体服从或近似服从正态分布;
③样本数据属于连续性数据。
案例4-4为考察某地区精准扶贫的成效,采用抽样调查的方法,收集到该地区20户村民在扶贫前后的家庭年收入,利用数据“扶贫效果.sav”,试推断该地区的扶贫措施是否有成效。
案例分析:农户扶贫前后年收入数据,属于前后两种状态的对比分析,数据只涉及一个样本,所以可用两配对样本t检验进行分析。
4.4两配对样本t检验
步骤1:
打开本章数据“扶贫效果.sav
扶贫效果.rar
(559 Bytes, 需要: 2 个论坛币)
本附件包括:
步骤2:
数据录入后,依次选择【分析】→【比较均值】→【配对样本T检验】命令,如右图所示。
4.4两配对样本t检验
步骤3:
单击【配对样本T检验】进入其对话框,如右图所示。把“扶贫前年收入”和“扶贫后年收入”添加到【成对变量】中,因为案例中只涉及一对变量,所以只要添加到【对】“1”中便可,如果需要配对的不止1对,那么只要重复刚才的步骤便可以完成要求。最后单击【确定】按钮,提交系统分析。
步骤4:结果解释。
包括如下统计量:扶贫前后年收入的均值、标准差以及均值标准误,初步看扶贫前的年收入与扶贫后的年收入均值有较大差异,扶贫前年收入的均值为7 930.90元,扶贫后年收入的均值为9 330.95元,但是我们研究的目的不是这20家农户的扶贫情况,而是利用这20户家庭的信息推测整个扶贫的效果,所以需要进行假设检验。
如下表所示,第三列可看出为扶贫前年收入与扶贫后年收入的相关系数为0.836,第四列相关系数检验的概率p值为0.000,小于0.05,表明扶贫前的年收入与扶贫后的年收入有较强的相关性。
由下表可知,扶贫前的年收入-扶贫后的年收入=-1 400.050元,说明扶贫后的收入从均值上来说增加了1 400.050元,自由度df为19(n-1=20-1),t检验统计量的观测值为-4.826,p=0.000<a=0.05时,拒绝原假设H0。可以看出扶贫前年收入与扶贫后年收入均值有显著差异,结合之前的的数据分析,也可以判断扶贫后的收入显著大于扶贫前的收入。

雷达卡




京公网安备 11010802022788号







