人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › SAS专版 › 有关重复测量ANOVA中的球形假定

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 下一页

发帖

楼主: kittyforever

29774 11

[实际应用] 有关重复测量ANOVA中的球形假定 [推广有奖]

11关注
2粉丝

硕士生

65%

还不是VIP/贵宾

威望: 0 级
论坛币: 1984 个
通用积分: 5.0475
学术水平: 14 点
热心指数: 11 点
信用等级: 7 点
经验: 7819 点
帖子: 203
精华: 0
在线时间: 124 小时
注册时间: 2009-11-14
最后登录: 2022-8-8

楼主

kittyforever 发表于 2013-1-11 16:17:35 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

有关重复测量ANOVA中的球形假定

记得我们曾经讨论过球形假定不满足时怎么办，当时没有答案，现在我发现了一段文章，很受益。大家也去看看：http://www.sciencenet.cn/blog/user_content.aspx?id=8968

文章指出：
球形检验的结果只是决定你将要用哪种输出结果，单变量的还是多变量的。这里特别要注意：球形检验的结果不是决定你是否使用重复测量的方差分析（这是在实验设计时的事情），而是决定在重复测量方差分析之后你选择哪种输出结果。如果选择单变量的，要么它满足球形检验，要么你就必须对结果进行校正。通常，如果不满足，最好还是选择多变量的结果！

当球形假定成立时，单、多变量的结果都可以用，差别不大；当球形假定（不）成立时，要么用多变量的结果，要么就用校正后的单变量的结果。
————————————————————————————————————
（原文转载如下）

最近分析数据需要用到重复测量的方差分析，就狠K了一番。翻译的比较匆忙，变看边写的没有什么思路。

1、利用SAS PROC GLM 程序进行重复测量的方差分析

本手册描述了如何利用SAS PROC GLM 程序进行重复测量的方差分析，包括对象间变量（a between-subjects variable）的分析。首先解释了何时该使用改方法；描述了本手册中用到的术语；给出了研究问题；最后，用一个详细的例子阐述了如何使用改程序。

假定你知道如何书写SAS的程序和导入数据文件以及运行SAS命令。此外，我们还假定你熟悉方差分析（ANOVA）的基本方法和假定。

2、何时使用重复测量的方差分析

任何方差分析都一样，重复测量的方差分析也是用来检验平均值的差别的。当在许多不同的条件下测量随机取样的所有成员时，使用重复测量的方差分析。由于样本是依次曝光于各个条件的，所以对因变量的测量是重复的。对此使用标准的ANOVA分析是不合适的，因为它不符合标准方差分析的前提假定：数据之间的独立性。需要注意的是，有些ANOVA设计综合了重复测量因子和非重复测量因子。只要有一个重复测量因子存在，就应该考虑使用重复测量的方差分析。

使用该方法有以下几个原因：

1)、一些研究的假说要求重复测量。比如，经度研究测量几个年龄的样本成员。在这个例子中，年龄应该是重复的因子。

2)、当取样成员之间存在很大的变异时，按标准方法得到的误差变异很大。对每个取样成员的重复测量可以减小改误差变异。

3）、当取样成员不宜获取时，重复测量的设计显得经济实惠，因为每个成员都可以用来曝光于所有的条件。

4）、注意的是重复测量的方差分析不能检验随机效应！

5)、当取样成员根据一些重要的特征配对后，也可使用重复测量方差分析。这里，每个配对的组具有相同的成员，组内每个成员都曝光于某个因子的不同的随机水平。当取样成员配对了，不同条件下的测量可以当作重复测量来看待。

比如，假定你选择了一组低气压对象，测量他们的气压水平，然后将那些具有相似气压水平的进行配对。然后给予每对中的一个成员低压处理，再次测量所有成员的低压水平。对此种情况，重复测量的方差分析是最有效的。当然，这里一个配对应当当作一个单一的取样成员。

应该认清重复测量设计和单纯的多变量设计之间的区别。对二者来说，都是多次测量取样成员，但是，在重复测量设计中，每次实验测量的是同一特征在不同条件下的数值。比如，你可以用重复测量方差分析来比较橘子树在不同年份所结的橘子的数目。测量的指标是橘子的数目，，这里的条件就是不同的年份。相反，对于多变量的设计，每次实验测量的是不同的特征。你不能够用重复测量的方差分析来比较橘子的数目、重量和价格。三个指标是数目、重量和价格，这些并不是代表不同的条件，只是不同的指标而已。

3、术语解释

对象：取样成员。

对象内因子：因变量多次测量，覆盖了所有的取样成员和一系列条件时，这一系列的条件就是对象内因子。

对象间因子：因变量多次测量，但是是基于所有成员的不同的独立的组，即成员已经分组了，这里每个组曝光于一个不同的条件，这里的条件就是对象间因子。

当分析里包含了双方时（对象内因子和对象间因子），就称为有对象间因子的重复测量方差分析。

4、实例研究

下面主要是举个例子来详细的说明如何使用重复测量的方差分析。假如你是一个健康问题专家，你期望弄清楚饮食习惯和锻炼对于脉搏速率的影响。为了达到这个目的，你收集了一组人的资料，并且根据他们的饮食偏好进行分组：肉食者和素食者。然后，在每个组内，又分成三个小组，每个小组随机配以下面三种锻炼中的一种：爬楼梯、短网拍墙球和重力训练。现在，你就设计了有2个对象间因子的实验：饮食偏好和锻炼类型。

5、确实数据的处理和非平衡设计

1)、对象内因子的主效应

运动的强度影响脉搏的速率（平均脉搏率在不同的实验水平上是否改变）。这就是对象内因子运动强度的主效应检验。

2)、对象间因子的主效应

饮食结构是否影响脉搏率（素食者与肉食者的平均脉搏率是否相等）？这就是对象间因子饮食偏好的主效应检验。

锻炼类型是否影响脉搏速率（爬楼梯的、打网球的与重力训练的平均脉搏率是否有差别）？这是对象间因子锻炼类型的主效应检验。

3)、对象间因子的交互效应

锻炼类型对脉搏速率的影响是否依赖于饮食结构。这是对象间因子锻炼类型与对象间因子饮食结构间的交互效应。也可以表示成饮食结构对脉搏速率的影响是否依赖于锻炼类型，结果是一样的。

4)、对象内与对象间因子的交互作用

饮食（对象间因子）对脉搏速率的影响是否依赖于运动的强度（对象内因子）？

锻炼类型（对象间因子）对脉搏速率的影响是否依赖于运动的强度（对象内因子）？

饮食（对象间因子）对脉搏速率的影响是否依赖于运动的强度（对象内因子）和锻炼类型？

6、零假说，Alpha，和P值

记住的是，检验的无效假说都是假定所比较的平均值之间没有差别。较大的F值对应着一个较小的P值。

1)、输出类型

当对象内影子超过两个水平时，PROC GLM 输出两个不同的结果：一个是使用多变量分析的结果；另一个是用单变量方法分析的结果。通常，这两种方法产生相似的结论。单变量分析来检验对象内因子的效应时要求球形假定。当至少有一个对象间因子有2个以上水平时，必须满足球形检验的条件。当你的对象内因子不满足球形假定，你要么用多变量分析方法，要么就校正单变量分析的结果（校正系数GG或HF）。

2)、转换变量

球形假定是通过转换因变量来实现的。代表每次实验的原始变量根据正交比较进行转换。转换的形式通常不影响检验的结果，只要转换矩阵是正交的。

3)、Mauchly球形检验和Epsilon校正系数

球形检验的结果只是决定你将要用哪种输出结果，单变量的还是多变量的。这里特别要注意：球形检验的结果不是决定你是否使用重复测量的方差分析（这是在实验设计时的事情），而是决定在重复测量方差分析之后你选择哪种输出结果。如果选择单变量的，要么它满足球形检验，要么你就必须对结果进行校正。通常，如果不满足，最好还是选择多变量的结果！

上面已经提到，另种方法就是校正你的单变量检验的自由度。通常有两种不同的校正因子，Greenhouse-Geisser Epsilon (G-G) 和 Huynh-Feldt Epsilon (H-F)。一般使用HF校正系数，因为GG校正系数被证实太保守了从而不能够观察到组间的差别。默认状况下，系统会自动对每个单变量F检验（涉及到对象内因子的效应）输出经GG和HF校正后的P值的。

正如上面提到的，即便球形假定不成立，多变量方法检验仍然是有效的。这就是说，当球形假定成立时，单、多变量的结果都可以用，差别不大；当球形假定成立时，要么用多变量的结果，要么就用校正后的单变量的结果！

在重复测量分析中，通常有四种多变量分析的方法，分别是：Wilks’ Lambda, Pillai’s Trace, Hotelling-Lawley Trace 和Roy’s Greatest Root。通常用第一种方法（Wilk）。

对于对象内因子的检验，上面说了可以有很多种检验的方法，单变量的多变量的，以及校正后单变量的。而对于对象间因子的检验，只有一种方法，也就是一般的线性模型。原文参考：http://www.ats.ucla.edu/STAT/sas/library/repeated_ut.htm 。

http://www.ats.ucla.edu/stat/Spss/code/rep_anova_sig.htm

http://www.visualstatistics.net/SPSS workbook/one-way_repeated_measures_anova.htm

http://www.lifesci.sussex.ac.uk/home/Zoltan_Dienes/SPSS 2-way rm.html

http://wwwstage.valpo.edu/other/dabook/ch12/c12-2.htm （推荐，使用SPSS进行数据分析！）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏14 回帖

关键词：ANOVA 重复测量 anov Nov Statistics 文章测量校正

本帖被以下文库推荐

· SAS与统计|主题: 115, 订阅: 148

使用道具举报

沙发

ziyenano 发表于 2013-1-11 18:49:53 |只看作者 |坛友微信交流群

感谢分享~方差分析是个难点，东西太多

使用道具举报

藤椅

henryyhl 发表于 2013-1-11 21:18:26 |只看作者 |坛友微信交流群

学习了，标记，有时间仔细研究。

It's not going to be easy, but it is going to be worth it.

使用道具举报

板凳

tmdxyz 发表于 2013-3-29 20:51:50 |只看作者 |坛友微信交流群

有关重复测量ANOVA中的球形假定，谢谢！

使用道具举报

报纸

doulaAmeng 发表于 2014-8-8 23:57:52 |只看作者 |坛友微信交流群

thanks~~~~~~~

使用道具举报

地板

shenweis 发表于 2014-8-9 09:52:22 |只看作者 |坛友微信交流群

如何解决医药分析中的重复测量问题
重复测量(Repeated Measures)是医学领域十分常见的一种情形，具体是指对同一研究对象的同一个测量指标或同一组测量指标，在不同时间点上进行多次重复测量，以用于分析测量指标随时间变化而产生的变化特点。这类测量资料在临床和流行病学研究中比较常见。例如，为研究各种新药对高血压病人的治疗效果，需要在服药后一小时、二小时、四小时、六小时等的时点分别测量受试者的血压，以分析其血压的变动情况。医学研究是应用统计分析方法最多的领域之一，统计分析方法也能帮助很好地解决上述问题。
粗看一下，很多人可能觉得运用t检验或方差分析作各测量时间点上的差别检验就能较好地解决上述问题。但实际上这样的处理方法是错误的，很可能会得出错误的结论。原因是应用传统的t检验或方差分析有一个前提条件，即数据的独立性，而医学领域的重复测量数据往往存在高度的相关性。例如张三服药二小时后的舒张压是90，那么四小时后他的舒张压也很可能在90附近，不会差得太远，这就是数据之间的相关性。如果此时去测李四，他的舒张压可能是70到110之间的任意值，因为这个数值与张三二小时后的舒张压值没有任何关系。因此，当t检验或方差分析的前提条件被破坏时，我们必须使用一套新的统计分析方法——重复测量的方差分析来校正原先的结果。
一般来说，重复测量的方差分析可分为三个主要步骤：
第一球形性检验
这里的球形性指的是协方差矩阵的球形性质，即矩阵的主对角线元素（方差）相等、非主对角线元素（协方差）为零。常用Mauchly氏法检验球形性。当球形性没有得到满足时，必须对与时间有关的F统计量的分子、分母自由度进行调整，以便减少犯第一类错误的概率。
第二方差分解及F检验
方差分解及F检验的概念相信大家都有所了解，但与传统方差分析不同的是，重复测量数据的误差结构分成两个层次：一层误差来自不同时间点的测量, 另一层误差来自不同的观察对象。而每一层的误差可能与若干个解释变量有关, 从而构成了相对复杂的误差结构。一般用来自不同观察对的误差检验组间效应（如不同药物），用来自不同时间点的误差分别检验组内效应（如不同时间）和组间效应与组内效应之间的交互作用。
第三绘制轮廓图
除了定量分析之外，还可以用可视化的方式（如轮廓图）来绘制测量指标在组间变量的不同水平上、不同测量时间点时的变化曲线（具体形式参见下文），以此反映组间效应的显著程度和指标随时间变化的趋势。测量时间间隔可以是等距的，也可以是不等距的。
下面用一个典型的生物医学实例来具体诠释一下“重复测量的方差分析”的整个过程，在涉及具体的统计计算时，一律采用JMP进行。采用JMP的原因，一方面是确保分析的权威性；另一方面是因为下面使用的功能都是其他同类软件所不具备的；另外JMP在分析结果的可视化、分析能力等方面较同类软件相比都有很大的优势。
案例分析
一项药物代谢动力学研究，目的是对比某种药物的不同剂型在体内的代谢速度。剂型分胶囊型和片剂型。将16名受试对象随机分为两组，每组8名。一组给予胶囊，另一组给予片剂，分别在服药后1小时、2小时、4小时、6小时及8小时测定血中的药物浓度。测定结果如以下图一所示，试选择合适的数理统计方法加以分析。

首先，执行Mauchly氏法球形性检验。从图二所示的计算结果来看，其对应的P值只有0.0014506，远小于0.01，显然不满足球对称性。因此进行下面的方差分析时，必须对组内效应的自由度用调整系数Epsilon进行调整。

其次，进行方差分解及F检验。由于球对称性没有得到满足，所以检验结果应以校正后的结果为准，即图三中用红框标示的部分。统计学推断为：不同剂型药物的血液浓度间的差异不显著（P值=0.0645），不同时间的血液浓度间的差异显著（P值<0.0001），剂型与时间之间无明显的交互作用（P值=0.3312/0.3366）。

最后，绘制轮廓图。图四就是根据各剂型、各时间点的平均值绘制而成的轮廓图。从图中可以更加直观地感受到：胶囊型与片剂型药物对血液浓度的影响是类似的，但不同时间点对血液浓度的影响则有明显的不同。而且由于随着时间的推移，两条折线几乎没有相交相交的趋势，说明剂型与时间之间确实不存在明显的交互作用。

再回到宏观层面上来看，近几年来国内频频发生的药品安全事故使药品的质量问题也成为医药企业甚至老百姓都高度关注的焦点话题。现在谁都会说几句“用数据管理”、“让数字说话”，但究竟怎样用数据管理、让数字说话呢？无论是医药企业的管理人员，还是技术人员都应该首先客观冷静地思考一下，寻找到正确的方向和合适的工具才是成功的基础。所幸的是，前文案例中引用的JMP软件在医药领域已有非常广泛的应用，在药品的研发和生产环节的质量改进方面已经拥有非常成熟的应用。药品管理单位也可通过JMP的专业分析结果来监管药品生产过程的规范性和安全性，这将极大地促进国内医药企业学习国外同行的先进经验，促进我国制药企业质量管理水平的提高。