楼主: Franz2010
26976 12

[学习资料] 方差分析的独立性检验? [推广有奖]

  • 2关注
  • 0粉丝

本科生

6%

还不是VIP/贵宾

-

威望
0
论坛币
309 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3249 点
帖子
44
精华
0
在线时间
106 小时
注册时间
2010-3-27
最后登录
2024-1-2

楼主
Franz2010 发表于 2011-4-20 22:46:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大虾,请问方差分析前需要样本具有独立性,怎样做样本的独立性检验?如果不能检验,为什么呢?希望能得到指教,非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:独立性检验 方差分析 独立性 非常感谢 样本 独立性

回帖推荐

wufei2134 发表于3楼  查看完整内容

方差分析(Analysis of Variance, 常简称为ANOVA)是用来检验两个以上样本的均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值总体的方法。   SST-总离差方和(Sum of Square in Total )为各样本观察值与总均值的离差平方和。   SSTR-组间离差方和(Sum of Square Treatment)表示不同的样本组之间,由于因素取不同的水平所产生的离差平方和。   SSE-组内离差方和(Sum of Square Error)表示同一样本组内,由于随机因素 ...

本帖被以下文库推荐

沙发
wufei2134 发表于 2011-4-20 22:50:49
我上传篇论文,分几个帖子给你打开,看看能不能给你点帮助~
长啸狂浪滔天多少真英雄,剑指苍茫天下生死笑谈中

藤椅
wufei2134 发表于 2011-4-20 22:51:32
方差分析(Analysis of Variance, 常简称为ANOVA)是用来检验两个以上样本的均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值总体的方法。
  SST-总离差方和(Sum of Square in Total )为各样本观察值与总均值的离差平方和。
  SSTR-组间离差方和(Sum of Square Treatment)表示不同的样本组之间,由于因素取不同的水平所产生的离差平方和。
  SSE-组内离差方和(Sum of Square Error)表示同一样本组内,由于随机因素影响所产生的离差平方和,简称为组内离差平方和。
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

长啸狂浪滔天多少真英雄,剑指苍茫天下生死笑谈中

板凳
wufei2134 发表于 2011-4-20 22:52:01
一、 检验
检验的用途是检验两个变量之间的独立性和检验数据是否服从某个概率分布得拟合检验。
我们经常会遇到受两个或两个以上因素(变量)影响的实验或观察数据,并要求判断两个变量之间是否存在相互联系的问题。如果两个变量之间没有联系则称作是独立的,否则就是不独立的。
用  分布可以检验两个变量之间的独立性问题。此时我们首先将研究对象的观察数据按两个变量分别进行分类。。例如,按行对第一个变量进行分类,按列对第二个变量进行分类。按这种方法把所有的试验观察数据排列成的表称为列联表。
独立性检验的程序和前面介绍的参数假设检验一样,首先也要建立假设,然后计算检验统计量的值。这次采用的检验统计这次采用的检验统计量就是  ,再根据问题规定的显著性水平 查  分布表,得到当原假设成立时检验统计量 允许的最大临界值,与计算所得的  值作比较,得出接受或拒绝原假设的结论。具体步骤如下:
长啸狂浪滔天多少真英雄,剑指苍茫天下生死笑谈中

报纸
wufei2134 发表于 2011-4-20 22:52:25
1. 提出假设
:两个变量是独立的,即相互之间没有影响,
  :两个变量是不独立的,即相互之间有影响。
    检验的结果如果接受原假设 就说明不能推翻两个变量是独立的假设;反之,拒绝 ,接受
2将观测数据分类,计算检验统计量 :
我们要将需要检验的变量分类,只作如下的表格:
        变量B的分类
变量A的类别                1        2        …..        m        行总和
        1        O11        O12        …..        O1m        O1.
        2        O21        O22        …..        O2m        O2.
        …..        …..        …..        …..        …..       
        k        Ok1        Ok2        …..        Okm        Ok.
        列总和        O.1        O.2                O.m        n
这里,Oij表示具有第ij属性的观测的数量,i=1,2,..k,j=1,2,…m, Oi.表示第i行的观测书的总值,O.j表示第j列的观测数的总数。注意,这里Oij是实际观测到的数据分类得到的。我们在后面还要计算在原假设成立的是观测的理论数值。这里n是观测的总数。
定义 = ,这里 是上边分类得到的实际观测数, 是与之相应的位置上的期望值。 是根据概率计算的,在原假设下两个变量独立,因而有:
如果两事件独立,则它们的联合概率就等于它们分别概率的乘积,即落入第i j格的概率等于落入第i 行的概率与落入第j 列的概率的乘积。由此可得到当总的观察值的和为n 时,与观察值 相对应的期望值 可按下式计算得到。
= ( )( )=
利用上面的公式可以计算出相应的个各个位置上的期望值。如果计算所得到的期望值过小,则最后得到的检验统计量 就会估计过大,导致原假设被拒绝的概率过高。因此,实际检验中一般要求所有计算得到的期望值都不小于5。如果某些位置上的期望值小于5就可以把相邻的类别合并,使得结果计算得到的期望值都不小于5。3计算 检验
我们在上边计算的 值,就是反映两个变量独立性程度的变量。如果 =0,那么这两个变量独立,当 不等于0, 越大两个变量独立的可能性越小,当 达到一定的程度时我们就可以拒绝两个变量独立的假设。
为了确定这个临界值,我们就需要使用 分布。首先我们需要确定 的自由度,由于在计算期望值的时候,每行总数和每列总数的总和是确定的,因此自由度是行数-1和列数-1的乘积。如果第一个分类变量有r类,第二个分类变量有c类,那么自由度就是:

这时,我们查自由度为 的 分布,和前面一样计算0.95得分位数,就得到显著性水平为5%的临界值 ,如果我们在第2布计算的   ,那么我们就要拒绝原假设,不能接受两个变量独立。
此外,  分布也可以用来检验数据是否服从某个分布,如正态分布,泊松分布,二项分布等。这时的检验也成为拟和优度检验。这种检验的方法也是先将变量分类,计算理论值和观测值,在计算统计量和自由度。具体的操作办法感兴趣的同学可以参看课本和课件。
长啸狂浪滔天多少真英雄,剑指苍茫天下生死笑谈中

地板
wufei2134 发表于 2011-4-20 22:53:05
二、方差分析
方差分析主要用来检验两个以上样本的均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值的总体。方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时是非常有用的。我们在前边的假设检验中,已经说明过了如何检验两个总体的均值是否相等的各种情况。方差分析的作用就是可以检验多个样本的均值是否相等。
1、问题的提出
例:为了比较三种不同材料对产品寿命的影响,试验人员分别对三种不同材料所制造的一组产品的寿命进行了测试,所得结果如下表所示 (为简化计算,以各取4个样本为例)。
      3三种材料使用寿命的抽样统计表
材料种类        实验1        实验2        实验3        实验4
A        115        116        98        83
B        103        107        118        116
C        73        89        85        97
现要求根据上述试验结果,在显著性水平为某一特定值的条件下,检验所选用的材料对最终产品的使用寿命的影响是否显著。从统计的角度看,就是要检验三种不同的材料所生产的最终产品的使用寿命的均值是否一致。
通常,在方差分析中,我们把对试验结果发生影响和起作用的自变量称为因素。如果方差分析研究的是一个因素对于试验结果的影响和作用,就称为单因素方差分析。否则就称为多因素方差分析。这里主要介绍单因素方差分析。
在本例中,因素就是可能影响产品使用寿命的材料。因素的不同选择方案称之为因素的水平。例中材料有三种不同的选择就说因素有三个水平。因素的水平实际上就是因素的取值或者是因素的分组,例如,可以在包装、质量、价格和销售区域等方面取不同的值或分为不同的组,就表示因素选了不同的水平。方差分析要检验的问题就是当因素选不同的水平时,对结果有无显著的影响。若无显著影响,则随便选择哪一种材料都无所谓。否则就要选择最终产品寿命最长的一种材料。
一般地,我们假定所检验的结果受某一因素A的影响,它可以取K个不同的水平:1,2,3,…K。对于因素的每一个水平i都进行n次试验,结果分别为  , ,。。。  ,我们把这一组样本记作假定  ,   即对于因素的每一个水平,所得到的结果都服从正态分布,且方差相等。
用统计的语言来表达,要检验的假设就是:
      
不是所有的  都相等 ( )。
由此可见,方差分析是研究一个或多个可分组的变量(称为自变量)与一个连续变量(因变量)之间的统计关系,并测定自变量在取各种不同水平时对因变量的影响和作用的一种统计分析方法。方差分析通过比较和检验在因素的不同水平下均值之间是否存在显著的统计差异的方法来测定因素的不同水平对因变量的影响和作用的差异。
长啸狂浪滔天多少真英雄,剑指苍茫天下生死笑谈中

7
Franz2010 发表于 2011-4-20 22:53:22
先谢谢了!

8
wufei2134 发表于 2011-4-20 22:53:52
2、方差分析的基本原理和步骤
  方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的一个估计值。另一方面,再考虑在同一水平下不同试验数据对于这一水平均值的方差。由此,计算出对由所有试验数据所组成的全部数据的总体方差的第二个估计值;最后,比较上述两个估计值。如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设。否则,就说明因素的不同水平下的均值间的差异比较大,就接受备择假设。
根据上述思路我们可以得到方差分析的方法和步骤。
(1). 提出假设:
  
不是所有的  都相等 ( )。
(2). 方差分解
我们先定义总离差平方和为各样本观察值与总均值的离差平方和。
记作 ,,其中 时样本平均值,   ,这里 是全部观测的总数。
将总离差平方和分解为两部分:
                                 
其中, 表示第 组的变量的平均值   ,记 表示不同的样本组之间,由于因素取不同的水平所产生的离差平方和。记 表示不同样本组之间由于因素水平不同产生的离差平方和。
因此我们得到 ,对应的自由度分别是 , 和 。这样一来,自由度也有关系:
(3). F检验
  将 和 分别除以各自的自由度,得到相应的各自均方差:
   组间均方差:   ;组内均方差:   ;
统计上可以证明 ,
如上所述,当原假设 成立时,  就有 。,否则有 。当原假设成立时, 和 都是 的无偏估计。可以构造F统计量,  ,就服从自由度为 和 的F分布。
如上所述,当原假设 成立时, 此时 较小,F 值也较小。反之  不成立时,  较大,F 值也较大。对于给定的显著性水平  ,查F 分布表得到  。如果 F> ,则原假设不成立,即K个组的总体均值之间有显著的差异,就拒绝  。若 F< ,则原假设成立,即 K个组的总体均值之间没有显著的差异,就接受  。
(4). 方差分析表
上述方差分析的方法可以用一张标准形式的表格来实现,这种表格称为方差分析表。它将方差分析的计算方法以简洁的形式进行总结。表格分为五列,第一列表示方差的来源,第二列表示离差平方和,第三列表示自由度,第四列为均方差,第五列为统计检验量F。
表格又分为三行。第一行是组间的方差SSTR和均方差MSTR,表示因素的不同水平的影响所产生的方差,其值作为计算统计检验量F时的分子;第二行是组内方差SSE和均方差MSE,表示随机误差所引起的方差,其值作为计算统计检验量F的分母,第三行是检验行,表示总的方差SST。
表6-9就是一张单因素方差分析表。
长啸狂浪滔天多少真英雄,剑指苍茫天下生死笑谈中

9
wufei2134 发表于 2011-4-20 22:54:15
由于方差分析表概括了方差分析中的统计量之间的关系,我们在进行方差分析时就可以直接按照方差分析表来逐行,逐列地计算出有关的统计量,最后得到检验量F的值,并把这一F值与查表所得到的一定显著性水平下的F检验的临界值进行比较,以得出接受或拒绝原假设的结论。
表6-9 单因素方差分析表
方差来源        离差平方和        自由度        均方差        统计检验量F
组间        SSTR        K-1        MSTR          

组内        SSE        N-K        MSE       
总方差        SST        N-1                

 方差分析表里的5个关系式:大家牢记这五个关系的计算就可以看懂方差分析表。
列的关系式:  ,  .   
行的关系式:   ,   。
3、用SPSS解方差分析问题
单因素方差分析用SPSS来解时可以通过完全窗口来解决,通过调用One-Way ANOVA菜单来实现。具体解法和步骤如下:
在主对话框中按Analysis →Compared Means→One-Way Anova的顺序点击,就可以打开"单因素方差分析"主对话框。在主对话框中先选择因变量。只要在左边的源变量框中选取所需要的变量,然后按因变量的向右的箭头,即可进入因变量位置。在选好因变量后再选因素框。同样只要从左边的源变量框中选取所需要的变量,然后按因素的向右的箭头,即可进入因素的位置。如果需要指定其它的比较选项再在Contrast中指定选项。对于简单的方差分析只要在主对话框中按OK,即可得到输出的方差分析结果。
长啸狂浪滔天多少真英雄,剑指苍茫天下生死笑谈中

10
Franz2010 发表于 2011-4-20 23:01:21
补充一下,我准备做单因素方差分析,需要检验样本数据的独立性,请指教,谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-4 03:56