在这里回答您所有的生存分析问题!
什么是生存分析?
生存分析的用途是什么?
什么是生存曲线?
什么是风险函数?
如何选择生存分析的模型?
什么是Kaplan-Meier模型?
什么时候Kaplan-Meier模型适用?
如何进行Kaplan-Meier分析?
什么是Cox比例风险模型?
Cox回归模型的假设是什么?
Cox回归模型的用途是什么?
如何拟合Cox比例风险模型?
如何解释Cox比例风险?
Cox比例风险模型对于Logistic回归的优势
什么是生存分析?
生存分析是一个统计领域工具,用于评估事件发生之前的时间。顾名思义,这个“事件”可能是死亡(患有特定疾病过程的人类,特定条件下的作物或植物,动物等),但也可能是任何其他选择(结构梁或工程部件的故障,疾病过程的再次发生等)。
在本文的其余部分,我们将看一个虚构的例子,关于不同饮食下家养狗的存活率。
生存分析的用途是什么?
生存分析用于描述或预测特定人群的生存(或失败)特征。通常,研究人员对各种治疗方法或预测变量如何影响生存感兴趣。
研究问题包括关于人口的一般寿命问题,例如:
- 一个特定物种的寿命特征是什么?
- 在一个特定的环境中,比如一个国家,人们能活多久?婴儿、儿童、成人和老年人等不同年龄组的生存率有何变化?
- 在制造产品中,如结构梁,在什么载荷下超过1%或5%的单元失效?
生存分析还提供了纳入协变量和其他预测因素的工具。在这种情况下,一些示例研究问题是:
[size=14.6667px]
- 各种因素和协变量(如遗传、饮食、运动、吸烟等)如何影响寿命?
- 对于被诊断为特定类型癌症的患者,各种药物治疗如何影响其寿命、预后或缓解的可能性?
- 制造过程(如温度、时间、材料组成等)如何影响产品(如结构梁)的故障率?
什么是生存曲线?
生存曲线绘制了生存函数,生存函数定义为在每个时间点(包括每个时间点)所关注的事件未发生的概率。
生存曲线或Kaplan-Meier曲线解读
通过我们的模拟数据,这张图表明,饮食2组,3年后,70%的狗存活下来,但4年后,只有大约25%的狗存活下来。这与饮食1组明显不同,饮食1组 4年后仍有90%的狗存活。
因为10年之后的生存曲线有大于0的概率,这个图显示了一些值被删失,这意味着一些狗在研究结束时仍然活着。根据被删失的观察结果,我们无法知道它们能存活多久。
在实践中,审查是一种非常常见的现象。一项研究的设计和资助时间是特定的,目的是观察感兴趣的事件,但这可能不是事实。此外,在这种情况下,狗可能在研究已经进行了七年之后才进入研究,所以在这种情况下,它们最多只被观察了三年。
在离散情况下,t时刻的生存函数S(t)为S(t) =t时刻后(不含)的生存概率。
在数学上,生存函数是1 -累积分布函数(CDF),或:
S(t) = 1 - F(t) = 1 - Pr {t≤t}
这意味着在离散情况下,概率密度函数(PDF)是事件在时间t发生的概率。


雷达卡





京公网安备 11010802022788号







