楼主: 逸水清尘1
1386 3

[问答] 生存分析phreg加权分析 [推广有奖]

  • 7关注
  • 0粉丝

已卖:42份资源

大专生

25%

还不是VIP/贵宾

-

威望
0
论坛币
190 个
通用积分
3.6723
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
2159 点
帖子
36
精华
0
在线时间
55 小时
注册时间
2015-2-12
最后登录
2024-11-13

楼主
逸水清尘1 发表于 2024-8-11 20:52:39 |AI写论文
15论坛币
本人在做数据分析过程中,使用PHREG过程,计算HR值。代码如下:cat表示需要计算此各个类别下的变量代表值;
subcat是指需要计算2组别相对于1组别的HR值;
duration是生存或者死亡时长;
cnsr代表事件或者删失;
wtdr是加权变量,表示每一名受试者都有一个加权值。
proc phreg data=ana;
  by cat;
  class subcat(ref='1');
  where subcat in (1,2)  and cat=1;
  model duration*cnsr(1)=subcat /  rl alpha=0.05;
  weight wtdr;
/*  freq wtdr;*/
run;


结局显示结果的事件和删失值为 396/1104,图

但用freq指定加权变量时,事件和删失值为加权后的总事件和删失:2155998/7775091人。

想请教下对于生存分析过程的加权应该以哪个为准,为什么?有参考资料的话最好了

weight_freq.png (49.58 KB)

weight_freq.png

weight.png (56.46 KB)

weight.png

关键词:phreg 生存分析 REG PHR Duration

沙发
赵安豆 发表于 2024-8-18 17:12:36
在使用PHREG过程进行生存分析时,`weight` 和 `freq` 语句的作用是不同的。这两个选项都是用来处理数据中的权重问题,但是它们代表的意义和适用的场景有所区别。

- **`weight`**:这个变量表示的是每条记录的相对重要性或者说是权重大小。在PHREG过程中使用 `weight` 变量时,它会调整每个观测值对最终结果的影响程度,但不会改变样本的大小或事件数的实际数值。`weight` 主要用来处理复杂抽样设计、不等概率采样等情况下的加权分析。

- **`freq`**:这个变量表示的是每条记录的实际重复次数。在PHREG过程中使用 `freq` 变量时,它会根据每个观测值的频率来调整事件数和样本大小,从而影响模型估计。如果一个记录的 `freq` 值为5,那么这条记录将被视为有5个相同的个体。

所以,在您的分析中,当您使用 `weight wtdr;` 语句时,SAS会根据每条观测值的权重调整其对生存函数和风险比(HR)的影响,但是事件数(396/1104)不会直接反映权重的大小。而如果您使用了 `freq wtdr;` ,则事件数将被更新为加权后的总事件数(2155998/7775091人),因为这表示实际发生的事件和删失次数按照每条记录的频率进行了累加。

**选择哪个加权方法取决于您的数据结构和研究设计:**

- 如果您的数据包含了抽样权重,以反映原始群体特征(例如,社会调查中的复杂抽样)或需要校正某些偏倚(如处理缺失值、非响应等),那么使用 `weight` 是合适的。
  
- 如果您有重复的观测记录,并且这些重复是由于同一个个体被多次测量或者是因为数据集中的某些观察单位实际上代表了多个相同的实体,这时候应该使用 `freq`。

**参考资料:**

1. SAS Institute Inc., "The PHREG Procedure: Weighted Estimation", SAS/STAT User's Guide, Version 15.1.
2. StataCorp LLC., "Stata Survival Analysis Reference Manual Release 16," Stata Press.

在学术文献中,通常会详细描述所使用的加权方法和其背后的理论依据。因此,在选择使用 `weight` 还是 `freq` 前,请确保理解您的数据特点以及分析需求,以作出合理的选择。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



藤椅
逸水清尘1 发表于 2024-8-18 20:27:26
赵安豆 发表于 2024-8-18 17:12
在使用PHREG过程进行生存分析时,`weight` 和 `freq` 语句的作用是不同的。这两个选项都是用来处理数据中的 ...
谢谢!目前我也查到了对于调查类的分析如何使用weight语句。不过用weight语句计算出来的标准差会很大,这里是怎么解释呢?
然后还有就是想请教下,是否有一种语句或者方法可以画出加权数据后的(weight)生存曲线图?对于lifetest是不能接受使用weight语句的。谢谢!

板凳
reduce_fat 发表于 2024-8-19 13:31:14
赵安豆 发表于 2024-8-18 17:12
在使用PHREG过程进行生存分析时,`weight` 和 `freq` 语句的作用是不同的。这两个选项都是用来处理数据中的 ...
https://bbs.pinggu.org/thread-11846871-1-1.html 能帮我解决一下这个帖子里的问题吗?谢谢。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-24 06:07