人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › SAS专版 › 关于重复测量方差分析的SAS程序请教！

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 下一页

发帖

楼主: zhangweibeckham

19719 14

[原创博文] 关于重复测量方差分析的SAS程序请教！ [推广有奖]

1关注
7粉丝

讲师

14%

还不是VIP/贵宾

威望: 0 级
论坛币: 48 个
通用积分: 75.0204
学术水平: 4 点
热心指数: 5 点
信用等级: 1 点
经验: 4177 点
帖子: 154
精华: 0
在线时间: 628 小时
注册时间: 2009-7-14
最后登录: 2023-8-24

楼主

zhangweibeckham 发表于 2010-12-26 12:55:48 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

有这样的一组试验数据：处理组别：A1(试验药高剂量）,A2（试验药低剂量）,C（安慰剂对照）；重复观测：T0（在用药之前的测量值），T1（用药之后1个月时的测量值），T2（用药之后2个月的测量值），T3（用药之后3个月的测量值）。另外A1入组12人，A2入组9人，A3入组13人，即unbalanced，想要知道3个处理组之间的治疗效果有无差异。程序：
data a;
input group $ t0 t1 t2 t3 @@;
cards;
A1 12 13 23 29
........
A2 13 24 34 29
........
A3 14 34 32 31
........
;
run;
proc glm data=a;
class group;
model t0 t1 t2 t3=group;
repeated time 4 contrast(1)/printe summary;
means group/snk lsd;
run;
quit;
其实，对于治疗效果还要考虑到基线值的差异（即清除T0的影响），所以应该把T0作为协变量来处理。在SPSS中是通过“Analyze"-"General Linear Model"-"Repeated Measures Define Factor(s)"然后再选择3个factors,作为时间因素，并把T0作为协变量，group作为between subject变量，再得出分析的结果。
那么，我用如下的程序是否就对了？
proc glm data=a;
class group;
model t1 t2 t3=group t0;
repeated time 3 contrast(1)/printe summary;
repeated time 3 contrast(2)/printe summary;
means group/snk lsd;
run;
quit;
我对了下SPSS和SAS的运行结果，出来的值（能对应的上的）都是一样的。
也欢迎各位大虾提供建议，多多批评和指正，先谢过了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏8 回帖

关键词：重复测量方差分析 sas程序方差分析重复测量 unbalanced 安慰剂测量程序

回帖推荐

sean1945 发表于4楼查看完整内容

1# zhangweibeckham 代码如下：没有原始数据，楼主自己运行一下吧。

本帖被以下文库推荐

· SAS精彩问答|主题: 2530, 订阅: 30

使用道具举报

沙发

zhangweibeckham 发表于 2010-12-27 18:23:57 |只看作者 |坛友微信交流群

期待回答啊。有没有在CRO公司或者在诺华、辉瑞等制药公司的统计分析部门的朋友，这种重复测量的方差分析肯定是会经常碰到的，所以还请大家多给意见和建议。

看来要和数据打一辈子的交道了！

使用道具举报

藤椅

sean1945 发表于 2010-12-28 11:21:47 |只看作者 |坛友微信交流群

1# zhangweibeckham

为什么不试试混合线性模型呢？(proc mixed)
1. GLM是应用最小二乘法原理计算协方差参数的，这一模型对协方差结构有极端的假定。当需要估计尽可能多的方差及协方差参数时，GLM模型有一定的局限性，而基于似然函数法原理的混合效应线性模型分析方法可满足不受协方差参数限制的要求，而且MIXED模型还可以分析观察时间点不相等的资料，也能充分利用具有缺失观察值的资料，它允许资料存在某种相关性及协方差矩阵的多样性，更适应重复测量资料的特点。
2. 一般线性模型（GLM）要求误差项e具有独立一致的正态分布，而许多实际资料不能满足这一假定。Mixed 模型允许误差项具有更灵活的结构，包括相关性和方差的不齐性。
3. 混合效应线性模型（proc mixed）采用最大似然估计法（maximum likelihood，ML）和约束最大似然估计法（restricted maximum likelihood，REML）原理计算协方差矩阵。
4. 应用混合效应线性模型的步骤：
  ① 确定固定效应和随机效应；
  ② 选择协方差结构，常见的有7种。
   a. 独立结构（又称方差分量结构） VC ，矩阵中含1个协方差参数；
   b. 复合对称结构CS，矩阵中含2个协方差参数；
   c. 空间幂相关结构 SP(POW)，含2个协方差参数；
   d. 无结构（又称不规则结构） UN，含n(n+1)/2个协方差参数；
   e. 一阶自回归结构 AR(1)，含2个协方差参数；
   f. 带状主对角结构 UN(1)，含n个协方差参数；
   g. 循环相关结构 TOEP，含n个协方差参数；
  ③上述不同的协方差矩阵中，选出似然比统计量（-2 Log Likelihood）、Akaike’s Information Criterion(AIC)、及Schwartz’s Bayesian Criterion（BIC）较小的一个。如果这些统计量很近似，则选含参数个数最少的一个，通常以AIC为主要判断指标。
  ④ 选定协方差结构后，再筛选固定效应参数，剔除无统计学意义的高阶效应。

已有 2 人评分	学术水平	热心指数	信用等级	收起理由
lilijenny	+ 1	+ 1	+ 1	学习了！
959712305	+ 1	+ 1	+ 1	学习了

总评分: 学术水平 + 2 热心指数 + 2 信用等级 + 2 查看全部评分

他大舅他二舅都是他舅，高桌子低板凳都是木头

使用道具举报

板凳

sean1945 发表于 2010-12-28 11:22:59 |只看作者 |坛友微信交流群

1# zhangweibeckham

代码如下：

Data a;
Input group pnt t0 t1 t2 t3 @@;
Cards;
1 1 12 13 23 29
1 2 . . . .
…
1 12 . . . .
2 1 13 24 34 29
2 2 . . . .
…
2 9 . . . .
…
3 13 . . .
;
Data a_b;
Set a;
Array t{4} t0 t1 t2 t3;
Do i= 1 to 4;
If i=1 then time=0;
If i=2 then time=1;
if i=3 then time=2;
If i=4 then time=3;
Y=t{i};output;
Timepnt=time;
End;
Drop i t0 t1 t2 t3 ;
Run;
Proc mixed data=a_b covtest method =REML;
CLASS group pnt;
Model y=group time group*time time*time time*time*group /S; /*选项S输出随机效应参数的解 */
Repeated /type= UN subject=pnt R; /* 选项R输出R矩阵的区块 */
Lsmeans group time / tdiff pdiff;
Run;
Proc mixed data=a_b covtest method =REML;
CLASS group pnt;
Model y=group time group*time time*time time*time*group /S;
Repeated /type= UN(1) subject=pnt R;
Lsmeans group time / tdiff pdiff;Run;
Proc mixed data=a_b covtest method =REML;
CLASS group pnt;
Model y=group time group*time time*time time*time*group /S;
Repeated /type= CS subject=pnt R;
Lsmeans group time / tdiff pdiff;
Run;
Proc mixed data=a_b covtest method =REML;
CLASS group pnt;
Model y=group time group*time time*time time*time*group /S;
Repeated /type= SP(POW)(timepnt) subject=pnt R;
Lsmeans group time / tdiff pdiff;
Run;
Proc mixed data=a_b covtest method =REML;
CLASS group pnt;
Model y=group time group*time time*time time*time*group /S;
Repeated /type= AR(1) subject=pnt R;
Lsmeans group time / tdiff pdiff;
Run;
Proc mixed data=a_b covtest method =REML;
CLASS group pnt;
Model y=group time group*time time*time time*time*group /S;
Repeated /type= TOEP subject=pnt R;
Lsmeans group time / tdiff pdiff;
Run;
/* 根据AIC准则，选择AIC较小的协方差结构，采用Type 3 tests of Fixed Effects 结果 */
/* Lsmeans 语句输出不同效应间两两比较的结果 */

复制代码

没有原始数据，楼主自己运行一下吧。

他大舅他二舅都是他舅，高桌子低板凳都是木头

使用道具举报

报纸

lookslike 发表于 2011-1-4 13:14:13 |只看作者 |坛友微信交流群

sean1945 发表于 2010-12-28 11:21
1# zhangweibeckham

为什么不试试混合线性模型呢？(proc mixed)
1. GLM是应用最小二乘法原理计算协方差参数的，这一模型对协方差结构有极端的假定。当需要估计尽可能多的方差及协方差参数时，GLM模型有一定的局限性，而基于似然函数法原理的混合效应线性模型分析方法可满足不受协方差参数限制的要求，而且MIXED模型还可以分析观察时间点不相等的资料，也能充分利用具有缺失观察值的资料，它允许资料存在某种相关性及协方差矩阵的多样性，更适应重复测量资料的特点。
2. 一般线性模型（GLM）要求误差项e具有独立一致的正态分布，而许多实际资料不能满足这一假定。Mixed 模型允许误差项具有更灵活的结构，包括相关性和方差的不齐性。
3. 混合效应线性模型（proc mixed）采用最大似然估计法（maximum likelihood，ML）和约束最大似然估计法（restricted maximum likelihood，REML）原理计算协方差矩阵。
4. 应用混合效应线性模型的步骤：
  ① 确定固定效应和随机效应；
  ② 选择协方差结构，常见的有7种。
   a. 独立结构（又称方差分量结构） VC ，矩阵中含1个协方差参数；
   b. 复合对称结构CS，矩阵中含2个协方差参数；
   c. 空间幂相关结构 SP(POW)，含2个协方差参数；
   d. 无结构（又称不规则结构） UN，含n(n+1)/2个协方差参数；
   e. 一阶自回归结构 AR(1)，含2个协方差参数；
   f. 带状主对角结构 UN(1)，含n个协方差参数；
   g. 循环相关结构 TOEP，含n个协方差参数；
  ③上述不同的协方差矩阵中，选出似然比统计量（-2 Log Likelihood）、Akaike’s Information Criterion(AIC)、及Schwartz’s Bayesian Criterion（BIC）较小的一个。如果这些统计量很近似，则选含参数个数最少的一个，通常以AIC为主要判断指标。
  ④ 选定协方差结构后，再筛选固定效应参数，剔除无统计学意义的高阶效应。

理论很深的嘛，学习了！

使用道具举报

地板

zhangweibeckham 发表于 2011-1-4 22:26:07 |只看作者 |坛友微信交流群

谢谢您的回答，非常详细，不过你的程序和思路和我想要的做的分析目的不同，我是想去出第一次观测的影响（即基线值的影响）去考察3个组别之间的治疗效果有没有差异，所以T0应该不能放在因变量中考虑，你这个模型是个更一般的方差分析，约束条件少了。我已经确定我的程序处理这种剔除基线差异的重复观测的方差分析是合适的。再一次感谢您使我受益匪浅！

看来要和数据打一辈子的交道了！

使用道具举报

7楼

墨岚 发表于 2011-12-10 03:12:14 |只看作者 |坛友微信交流群

呵呵要去除基线值影响的话在PROC mixed /glimmix 里面加个RANDOM语句就OK了~

要踏实，也要巧劲，唯独不要怨艾。

使用道具举报

8楼

zzheng722 发表于 2011-12-25 11:49:19 |只看作者 |坛友微信交流群

同意“sean1945"的说法，用proc mixed 是目前最好的方法。你用MANOVA得出的东西还是要用ANOVA两两时间去比，并且要考虑多重比较的alpha.

MIXED model 利用了各时点的相关性，节省了样本。如”想去出第一次观测的影响（即基线值的影响）去考察3个组别之间的治疗效果有没有差异，“，把基线值作为协变量即可。

Proc mixed data=a_b covtest method =REML;
  CLASS group pnt;
  Model y=group time group*time t0/S;
  Repeated /type= CS subject=pnt R;
  Lsmeans group time / tdiff pdiff;
Run;

使用道具举报