本文涵盖了Prism中可用的生存分析方法,包括Kaplan-Meier生存估计以及使用Cox比例风险回归进行生存分析。这两种方法截然不同,它们在各自的页面上都有详细的解释。
- 生存分析的基本概念
- Prism中的生存分析方法
- 如何进行Kaplan-Meier(非参数)生存分析
- Kaplan-Meier生存分析的结果
- 如何进行Cox比例风险回归
- Cox比例风险回归的结果
Kaplan-Meier生存分析的结果
本文将帮助您解读Prism生成的Kaplan-Meier生存曲线以及Prism对这些曲线进行的相关检验。
- 解读结果:生存比例
- 什么决定了生存曲线的高低?
- 解读结果:风险数量
- 解读结果:P值
- 解读结果:风险比
- 解读结果:中位生存时间
- 解读结果:中位生存时间比率
- 解读结果:比较两条以上生存曲线
- 趋势的对数秩检验
- 生存曲线的多重比较
- 绘图技巧:生存曲线
- 确定中位随访时间
[size=14.6667px]
解读结果:生存比例
Kaplan-Meier生存分析的主要结果之一是每个时间点的生存比例或百分比。这些值通常以图形方式呈现,但有时查看这些结果的表格也很有用。这些值的分析结果表默认是隐藏的。要查看它,只需点击分析选项卡右侧的下拉菜单,并从列表中选择它。
生存比例
Prism使用Kaplan-Meier(乘积极限法)方法计算生存比例。对于每个X值(时间),Prism报告观察到事件发生的比例(或百分比)(如果累计发生率图是作为生存图的替代生成的,这些值将代表观察到事件发生的比例/百分比)。这些是创建生存图(或累计发生率)与时间所需的值。
如上期文中所述,用于生成这些比例的计算考虑了删失观察。观察被删失(要么因为他们离开了研究,要么因为研究结束)的受试者在删失时间之后不再提供任何信息。这儿意味着生存百分比的计算比简单的分数要复杂一些。虽然直觉上曲线应该以生存分数作为经历事件的受试者总数除以总受试者数结束,但这只有在没有删失数据时才正确。如果有些观察被删失,那么计算就更复杂了(这就是Kaplan-Meier方法旨在处理的情况)。
如果时间到事件的时间与其他受试者的删失时间相同,Prism进行计算时假设事件先发生。
生存百分比的置信区间
Prism将生存概率的不确定性报告为标准误差或95%置信区间。标准误差通过Greenwood方法计算。
在计算95%置信区间时,Prism提供以下选择方法:
- 非对称方法(推荐)。这些置信区间是使用对数-对数变换方法计算的,该方法也被称为指数Greenwood公式。此方法在Machin的第42页和第43页由解释。通过将误差方法设置为Greenwood并将类型设置为对数-对数,您将从生存R函数获得相同的结果。这些区间适用于每个时间点。其理念是,在每个时间点,有95%的概率该区间包含真正的总体生存概率。我们称这种方法为非对称,因为区间在生存比例上方延伸的距离通常不等于在下方延伸的距离。这些被称为逐点置信限。(在Prism中也可以,但不提供)计算包含整个总体生存曲线的95%置信带。这些置信带比逐点置信限更宽。
- 对称方法。这些区间在每个方向上按1.96倍标准误差计算。然而,请注意,在某些情况下,用这种方法计算的置信限可能会延伸到0以下或1以上(或100%)。在这些情况下,置信限会被修剪到这些极限以避免不可能的值。不推荐这种方法,我们提供这种方法只是为了与旧版本的Prism兼容。
Kaplan-Meier方法的工作原理
Kaplan-Meier方法在逻辑上很简单。对于每个时间点,它首先计算在该时间点之前或之时未发生事件的受试者比例。为此,它用在该时间点之前未发生事件的受试者数量除以总受试者数量(排除在该时间点被截尾的观测值,从分子和分母中都排除)。
然后,它计算从时间0开始直到数据集中每个特定时间点未发生事件的受试者比例。这是通过将第一个时间点计算出的比例乘以每个后续时间点计算出的比例来实现的。例如,如果时间点是以天为单位表示的,那么它从计算第1天的比例开始。然后它将这个比例乘以第2天计算出来的比例,得到一个新的值。接着它将这个新值乘以第3天计算出来的比例,以此类推。通过这种乘法过程直接到第“K”天,得到所有在第K天结束时未发生事件的受试者比例,或者换句话说,第K天的生存概率。Kaplan-Meier方法通过从分数的分子和分母中移除被截尾观测值的那天自动考虑截尾观测值。这种重复的乘法过程就是该方法名称的由来:乘积限法。
参考文献
- David Machin, Yin Bun Cheung, Mahesh Parmar, 《生存分析:实用方法》,第二版,ISBN:0470870400
什么决定了生存曲线的高低?
如果没有删失观测值且所有个体都经历了死亡(感兴趣的事件)
那么生存曲线将追踪时间直至任何一次性事件,然后曲线最终将达到0。当最后一个个体经历感兴趣事件时,生存概率将为零。
如果所有个体被追踪的时间完全相同
如果都时间相同,情况就很简单了。如果三分之一的个体在研究结束时还没经历感兴趣事件,那么生存概率是33%。
如果一些个体在过程中被删失
如果对任何个体的观测被删失,那么生存曲线底部的点将不等于在研究结束时没有经历感兴趣事件的个体比例。
在删失之前,个体对分数生存概率有贡献。之后,他或她不会影响计算。在任何给定时间,生存概率值是那些存活下来的个体所遵循的比例。
那些观测值被删失的个体-要么是因为他们离开了研究,要么是因为研究结束-不能提供超出删失时间的任何信息。您要知道他们是否会在删失时间之后经历感兴趣事件(或者您知道,但不能使用这些信息,因为实验方案不再被遵循)。所以如果在生存曲线的X轴上最后显示的时间之前有任何个体被删失,生存图上显示的最终生存概率将与没有经历感兴趣事件的个体的实际比例不符。您可以轻松手动计算的简单生存率是没有意义的,因为并非所有个体都被追踪相同的时间。
生存曲线何时会降至零?
如果生存曲线一直下降到0%存活率,这并不意味着研究中的每个个体都经历了感兴趣的事件。
有些个体可能在较早的时间点被删失(要么是因为他们离开了研究,要么是因为在他们经历感兴趣事件之前研究就结束了)。当最后一个时间点观察到的个体是经历了感兴趣事件的个体,而不是被删失的个体时,生存概率将降至零。如果您的数据按X值(Prism可以使用“编辑>排序”来进行此操作)排序,曲线将下降至0%存活率(如果最后一个Y值为1,表示感兴趣事件),并且如果最后一个Y值为0(表示删失),则曲线将在0%以上结束。
下面的例子中,感兴趣的事件是死亡。十名受试者中有四人死亡。但生存曲线下降到零,而不是60%,为什么?因为有六名受试者在1到27个月之间被删失。我们不知道如果他们留在研究中直到第28个月会发生什么。由于我们不知道他们是否会存活或死亡,他们的数据在删失时间之后就不再计入(但在删失时间之前肯定会计入)。在第27个月时,只有一名受试者仍在被追踪,并且他或她在第28个月后死亡,使生存概率降至零。
解读结果:风险数量
不同时间处于风险中的个体数量
风险数量表背后的理念是-为了使用Kaplan-Meier产品极限法计算生存概率,我们需要知道在研究中还未经历感兴趣事件的个体数量。因此,在任何特定时间点的风险数量将等于此时仍留在研究中的个体总数,包括所有尚未经历感兴趣事件或尚未在此时被审查的个体。如果您的时间单位是“天”,您可以考虑在一天开始时(在任何事件或审查可能发生之前)处于风险中的个体数量。
请记住,除非个体经历感兴趣事件或被审查,否则风险数量不会改变。因此,我们只需要在这些情况发生时报告新的风险数量。
考虑一个使用Prism中可用的样本生存数据的示例。在“欢迎对话框”中,选择生存数据表类型,然后选择“从样本数据开始进行教程”。选择教程数据集“比较两组”,然后点击“创建”。数据如下表所示。
如果您切换到生存结果表,并选择风险数量选项卡,该表将包含以下值:
考虑“控制”列中的值。实验开始时,对照组有8个对象。第一次涉及对照组对象的时间点是在第46天(本节第一个表)。在这个时间点之前,仍有8个对象被认为是“处于风险中”,因此在此表中显示的值是8。在这个时间点,有一个对象经历了感兴趣的事件并被审查,导致两名患者从“处于风险中”组中被移除。下一个涉及对照组对象的时间点出现在第64天。因为这个组开始时有8个对象,并且在46天后有两个对象从“处于风险中”组被移除,所以在第64天对照组的新“处于风险中”总数是6。在这个时间点有一个对象被审查,下一个涉及对照组的时间点出现在第78天。
按照同样的逻辑,在第64天后有一个对象从“处于风险中”组中被移除,所以在第78天“处于风险中”组的新总数是5。这种技术可以用来确定每个组在每个相关时间点处于风险中的对象数量。
请注意,Prism不会自动绘制此表格。但是,如果您想要绘制风险中对象数量随时间变化的图表,可以执行以下步骤:
- 导航到“风险中对象数量”结果标签。
- 在工具栏的“表格”部分点击“创建新图表”按钮。
- 在出现的对话框中,从下拉菜单中选择“风险数量表”中的“数据集绘图”。在“图表类型”部分选择“X-Y”。
- 选择您喜欢的图表类型(尝试仅点或点与连接线)并点击“创建”。
- 将Y轴标题从默认的“风险数量”更改为“风险中对象数量”。
[size=14.6667px]
解读结果:P值
在将数据输入到Prism中的生存数据表后,分析会自动进行。当输入的数据涉及多个组(数据集)时,Prism将包括比较各组的检验。在结果表的曲线比较选项卡上,将为Prism执行的每项检验报告一个P值。
解释P值
Prism执行的每项检验的零假设是,每个组中抽样的总体的生存曲线是相同的。换句话说,如果两个组代表一个“处理”组和一个“对照”组,零假设是处理对生存没有影响。
这些检验的P值回答了这个问题:
如果零假设为真,随机选择生存曲线与实际观察到的差异(或更大)的受试者的概率是多少?
如果P值足够小(小于预先设定的阈值),那么我们就拒绝零假设。请注意,P值是基于比较整个生存曲线,而不是仅比较每组的中位生存时间。
单尾P值
Prism在比较生存曲线时总是报告双尾P值。如果您想报告单尾P值,您必须事先预测哪个组在收集数据前会有更长的中位生存时间。计算单尾P值取决于您的预测是否正确。
- 如果您的预测正确,单尾P值将是双尾P值的一半。
- 如果您的预测错误,单尾P值等于1减去双尾P值的一半。这个值将大于0.50,并且您不会拒绝生存曲线相同的零假设。
[size=14.6667px]
解读结果:风险比
关于风险比的关键事实
- 风险是指事件发生的频率与单位时间的关系,通常可以被认为是生存曲线的“斜率”。它是衡量受试者经历事件的速度的一种方法。
- 风险比是两组之间风险的比较。如果风险比为2.0,那么一组中事件发生的速度是另一组的两倍。
- 风险比不是在任何单一时间点计算的,而是从生存曲线内包含的所有数据中计算出来的。
- 由于只报告了一个风险比,只有在假设人口风险率随时间保持一致,并且所有差异都是由于随机抽样造成的情况下,才能进行解释。这被称为比例风险假设,是Cox回归中的一个基本假设。
- 如果风险率随时间不一致,Prism报告的风险比将毫无用处。如果两条生存曲线交叉,风险率肯定不一致(除非交叉发生在后期时间点,且只有少数受试者仍在被随访,因此生存曲线的真实位置存在很大不确定性)。
- 风险比与中位生存时间的比率没有直接关系。风险比为2.0并不意味着中位生存时间加倍(或减半)。风险比为2.0意味着在某一时间点,一组中未经历事件的受试者在下一个时间点经历事件的概率是另一组受试者的两倍。
- Prism计算风险比及其置信区间-使用下面解释的两种方法。对于每种方法,Prism报告风险比及其倒数。如果A组受试者经历事件的频率是B组受试者的两倍(即HR=2.0),那么根据定义,B组受试者经历事件的频率将是A组受试者的一般(HR=1/2.0=0.5)。
- 关于解释风险比的其他注意事项,参见Hernan和Spruance的两篇综述。
- Duerden写了一篇易于理解的风险比解释。
两种方法比较
Prism通过两种方法计算风险比:对数秩(logrank)和曼特尔-亨赛尔(Mantel-Haenszel)。这两种方法通常给出相同(或近乎相同)的结果。然而,当几个受试者在同一时间经历感兴趣事件(所谓的“打结观察”)或风险比远非1.0时,结果可能会有所不同。
Bernstein及其同事用这两种方法分析了模拟数据。在他们所有的模型中,比例风险假设都是正确的,并且这两种方法产生了非常相似的值。对数秩方法(他们将其称为O/E方法)报告的值更接近于1.0,而不是真正的风险比,特别是当风险比很大或样本量很大时。
当存在打结时,两种方法都不太准确。对数秩方法倾向于报告更接近1.0的风险比(因此当报告大于1.0时,报告的值过大,而当报告小于1.0时,报告的值过小)。相反,曼特尔-亨塞尔方法报告的风险比离1.0更远(因此当报告大于1.0时,报告的值过大,而当报备小于1.0时,报告的值过小)。
当两种风险比非常不同时意味着什么?
Bernstein及其同事没有用模拟数据(其中比例风险假设不成立)比较这两种方法。在一个单独的数据示例中,比例风险假设一开始就很可疑,两种方法之间的风险比差异很大(相差三倍)。似乎曼特尔-亨塞尔方法在后期时间点对风险率的差异基于更多权重,而对数秩方法对所有时间点给予同等权重。
如果您观察到这两种方法的风险比非常不同,请思考比例风险假设是否合理。如果该假设不合理,那么用单一风险比描述整个曲线的概念就没有意义。
风险比是如何计算的?
Prism用于报告风险比的对数秩和曼特尔-亨塞尔方法非常相似。两者都在Machin、Cheung和Parmar的《生存分析》第三章中进行了解释。
曼特尔-亨塞尔方法:
1. 计算总方差V
2. 计算:
[size=14.6667px]
其中,O1是组1中观察到的事件总数,E1是组1中预期的事件数。如果使用另一组,您会得到相同的L值。
3. 注意,L是风险比的自然对数,所以:
4. 风险比的95%置信下限为:
5. 风险比的95%置信上限为:
对数秩方法:
1. 作为Kaplan-Meier计算的一部分,计算每组中观察到的事件数量(通常是死亡数)( Oa 为A组观察到的事件数量,Ob为B组观察到的事件数量),以及假设生存无差异的情况下事件的预期数量(Ea为A组事件的预期数量,Eb为B组事件的预期数量)。
2. 风险比为:
3. 计算风险比的自然对数:
4. 风险比自然对数的标准误差为:
5. 风险比的95%置信下限为:
6. 风险比的95%置信上限为:


雷达卡









京公网安备 11010802022788号







