楼主: 一心搞数据
1198 2

[问题] 生存资料怎么处理缺失 [推广有奖]

  • 0关注
  • 0粉丝

已卖:8份资源

讲师

10%

还不是VIP/贵宾

-

威望
0
论坛币
3443 个
通用积分
12.1373
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
43933 点
帖子
57
精华
0
在线时间
785 小时
注册时间
2023-8-22
最后登录
2025-12-23

楼主
一心搞数据 发表于 2023-9-26 16:45:19 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
随访数据因为随访多年有人死亡或失访,许多样本的变量信息缺失严重(分类变量和数值变量都有)。需要做的是生存分析,有生存时间和事件,随访数据中变量缺失比例大多在30%-45%之间,现在缺失那么多大家有什么好的建议吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:怎么处理 Data 分类变量 生存分析 数值变量 缺失值 生存分析

沙发
sun_man 在职认证  发表于 2023-9-28 15:29:13
在面对数据缺失问题时,有几种常见的处理方法可以考虑:

完全案例分析(Complete Case Analysis):只使用完全没有缺失数据的样本进行分析。这种方法简单直接,但会忽略掉有缺失数据的样本,可能导致样本量减少和结果偏差。

插补法(Imputation):通过填补缺失值来估计缺失数据。常见的插补方法包括均值插补、回归插补、多重插补等。插补方法可以提高样本量和结果的准确性,但需要注意插补方法的选择和合理性。

可用数据最大化(Maximizing Available Data):尽量利用有限的可用数据进行分析。可以根据研究目的和数据情况,选择最相关的变量进行分析,或者使用子集分析等方法。

敏感性分析(Sensitivity Analysis):通过对缺失数据进行不同假设和处理方法的敏感性分析,评估结果的稳健性和可靠性。

在你的情况下,由于data2中变量缺失比例较高,完全案例分析可能会导致样本量过小。您可以考虑使用插补法来填补缺失数据,例如使用回归插补或多重插补方法。此外,您还可以进行敏感性分析,评估不同处理方法对结果的影响。

需要注意的是,选择合适的方法需要根据具体的数据情况和研究目的来决定。建议在进行分析之前,仔细评估数据缺失的原因、缺失模式以及可行的处理方法,并在分析结果中适当地讨论和解释缺失数据对结果的影响。

藤椅
一心搞数据 发表于 2023-9-28 19:40:01
sun_man 发表于 2023-9-28 15:29
在面对数据缺失问题时,有几种常见的处理方法可以考虑:

完全案例分析(Complete Case Analysis):只使 ...
from GPT?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-24 02:47