本文涵盖了Prism中可用的生存分析方法,包括Kaplan-Meier生存估计以及使用Cox比例风险回归进行生存分析。这两种方法截然不同,它们在各自的页面上都有详细的解释。
- 生存分析的基本概念
- Prism中的生存分析方法
- 如何进行Kaplan-Meier(非参数)生存分析
- Kaplan-Meier生存分析的结果
- 如何进行Cox比例风险回归
- Cox比例风险回归的结果
Kaplan-Meier生存分析的结果
本文将帮助您解读Prism生成的Kaplan-Meier生存曲线以及Prism对这些曲线进行的相关检验。
- 解读结果:生存比例
- 什么决定了生存曲线的高低?
- 解读结果:风险数量
- 解读结果:P值
- 解读结果:风险比
- 解读结果:中位生存时间
- 解读结果:中位生存时间比率
- 解读结果:比较两条以上生存曲线
- 趋势的对数秩检验
- 生存曲线的多重比较
- 绘图技巧:生存曲线
- 确定中位随访时间
解读结果:中位生存时间
中位生存时间
中位生存时间是指生存概率等于50%的时间点,需要注意:
- 如果在最长时间点的生存概率超过50%,则中位生存时间无法计算。Prism会报告中位生存时间为“未定义”。对数秩检验比较的是整条生存曲线,并不比较中位生存时间。因此,即使一个或两个中位生存时间未定义,对数秩检验计算出的P值仍然有效。
- 如果生存曲线在50%生存率处是水平的,那么中位生存时间就不明确。在下图的生存曲线中,曲线在9到17个月之间在Y=50%处是水平的。Prism遵循Machin的建议,报告中位生存时间为这两个值的平均值,在这种情况下是13个月。
[size=14.6667px]
[size=14.6667px]
- Prism(和大多数程序一样)将中位生存时间定义为阶梯生存曲线穿过50%生存率的时间点。这是对数据集中实际包含的受试者或动物中位生存情况的准确描述。下方图表展示了Prism如何计算中位生存时间(此例中为211天)。如果用点对点连线而不是阶梯连接生存时间,您会发现这条线可能会在更早的时间点与Y=50%相交,从而得出不同的中位生存时间值(在此例中为193天)。如果您试图预测未来患者的中位生存时间,这种方法是有意义的。但Prism不这样做,因为这不是标准作法。
解读结果:中位生存时间比率
中位生存时间比率
如果您比较两条生存曲线,Prism会报告这些曲线的中位生存时间比率,以及该比率的95%置信区间和倒数。计算生存时间比率的置信区间是基于一个假设,即两条生存曲线都遵循指数衰减,这在研究和实践中并不完全复合生存比较的其余部分。这意味着在小时间间隔内经历事件的概率在研究早期和晚期是相同的。如果您的生存数据呈现出非常不同的模式,那么Prism报告的95%置信区间的中位生存时间比率将没有意义。
Prism为何不计算中位生存时间的置信区间
虽然Prism会计算中位生存时间比率的置信区间(当比较两组时),但它不会独立计算每组中位生存时间的95%置信区间。原因是已经发布了多种计算中位生存时间置信区间的方法,但没有一种方法看起来是标准的,且结果不一致。
解读结果:比较两条以上生存曲线
对数秩和Gehan-Breslow-Wilcoxon检验
Prism进行的每项检验的零假设是,每个组中抽样的总体的生存曲线是相同的。换句话说,如果两个组代表一个“处理”组和一个“对照”组,零假设处理对生存没有影响。
这些检验的P值回答了这个问题:
如果零假设为真,随机选择生存曲线与实际观察到的差异(或更大)的受试者的概率是多少?
如果P值足够小(小于预先设定的阈值),那么我们就拒绝零假设。请注意,P值是基于比较整个生存曲线,而不是仅比较每组的中位生存时间。
对数秩检验和Gehan-Breslow-Wilcoxon检验的区别在于,后者更侧重于早期时间点发生的感兴趣事件。请注意,当比较三个或更多组时,Prism允许您选择两种算法之一来计算P值。结果将显示为“保守”或“推荐”,以记录您的选择。
对数秩趋势检验
如果您选择比较三条或更多生存曲线,Prism将报告整体对数秩检验的结果以及对数秩趋势检验的结果。
何时应查看趋势检验的结果?
只有当组的顺序(由Prism中的数据集列定义)是逻辑顺序时,才应查看趋势检验的结果。例如,如果组代表不同的年龄范围、不同的疾病严重程度或不同的药物剂量,那么生存数据表中这些组的从左到右的顺序必须与有序且等距的类别相对应。如果数据没有排列(或等距排列),那么您应该忽略趋势检验的结果。
趋势检验的对数秩检验结果
趋势检验的对数秩检验报告一个卡方值,该值总是与1个自由度相关(无论比较多少组)。它使用卡方值来计算一个P值,以检验组的是顺序和中位生存时间之间不存在线性趋势的零假设。如果所得的P值小于预先设定的阈值(通常为0.05),则可以拒绝这个零假设。
Prism假设组是等距排列的
计算趋势的对数秩检验需要为每个组分配一个组码。然后检验观察这些组码与生存之间的趋势。在其他一些程序中,您可以手动分配这些代码,从而处理非等距排列的有序组。Prism使用列号作为代码,因此它只能在假设组是等距排列的情况下执行趋势检验。即使您输入数字作为列标题来表示代码数字,Prism也不会使用这些来执行趋势检验。
工作原理
趋势对数秩检验观察Prism中列号所指定的组码与生存情况之间的线性趋势。然而,它并非简单地观察中位生存时间、五年生存时间或其他任何特定的汇总指标。它首先计算假设所有组中的受试者都来自具有相同生存经验的总体的预期生存情况。然后,它量化观察到的生存情况与每组预期生存情况之间的总体差异。最后,它观察这些差异与相应组码之间的趋势。
多重比较检验
在比较三个或更多治疗组后,您可能希望返回并对个体生存曲线进行两两比较(一次查看两条特定曲线)。Prism不会自动执行此操作,但很容易复制分析并将新副本修改为仅包含要比较的两个组。这个过程可以对每对期望的生存曲线重复进行。请注意,如果您手动执行这些两两比较,您将需要手动调整确定P值“显著性”的阈值。或者您可以将每个计算出的P值复制到一个新的数据表列中,并分析那一对P值。
趋势的对数秩检验
对数秩检验用于比较三个或更多生存曲线。为了使该检验的结果有意义,生存数据表中的组(列)顺序必须是自然顺序。例如,可以是年龄组、癌症阶段或治疗剂量。此外,这些组必须是等距的。该检验本质上是检查是否存在线性趋势中位数生存和每组的顺序。
选择趋势的对数秩检验
Prism将在您通过默认值包括三个或更多组(列)时计算趋势的对数秩检验,用于数据生存分析。如果您愿意,可以在参数对话框中禁用此检验。
何时查看趋势检验的结果?
该趋势检验仅在组的顺序(由数据集中的列定义)在Prism中是逻辑顺序时才有意义。例如,如果组代表不同年龄组、不同疾病严重程度或不同药物剂量。在生存数据表中的左-右顺序这些组必须对应于有序且等距的类别。如果数据未排序(或等距),那么您应该忽略上面提到的对数秩检验结果。
趋势的对数秩检验结果
对数秩检验趋势报告一个卡方值,该值始终与一个自由度相关,它使用卡方值来计算一个P值,测试零假设即组间的自由度与中位数生存时间之间没有线性趋势。如果所得P值小于预先设定的阈值(通常为0.05),则可以拒绝零假设。
Prism假设组是等距的
计算趋势的对数秩检验需要为每个组分配一个组代码。该检验然后查看这些组代码和生存之间的趋势。对于某些程序,您可以手动分配这些代码,并处理非等距组。Prism使用列号作为代码,因此它只能对假设组是等距的趋势进行检验。即使你输入数字作为列标题来表示组代码,Prism也不会使用这些来进行趋势检验。
生存曲线的多重比较
多重比较的必要性
当您同时比较三条或更多生存曲线时,您会得到一个单一的P值。这个P值用于检验零假设,即不同组中的所有受试者都来自具有单一生存特征的单一总体,并且各组生存的任何差异都是由于随机抽样造成的。然而,与其关注所有组都来自单一总体的零假设,您可能更感兴趣的是同时比较两个特定组。
这可以通过手动将每个组的数据复制到一个新的生存数据表中(或复制现有表格并调整应包含在分析中的组)来完成。但是,如果您在这样做之后不调整多重比较,很容易得到会让您误以为这些组来自单一总体的P值。当您进行许多成对比较时,出现一个或多个组对产生低于规定阈值的P值(从而错误地提示拒绝零假设)的可能性纯粹是偶然的。为避免犯此错误,您应对多重比较进行校正。
生存曲线的多重比较是如何进行的?
在方差分析(ANOVA)之后进行多重比较是复杂的,因为它们不仅对显著性使用更严格的阈值,还包括来自所有组在计算方差(离散度)时的数据,并将此值用于每次比较。通过量化所有组的离散度-不仅仅是您正在比较的两组-您获得了一些自由度,并随后获得了一些额外的功效。
用于比较生存曲线的多重比较检验较为简单。您只需调整用于确定P值“足够小”以拒绝零假设的阈值,并且不需要考虑关于未包含在比较中的组的任何信息(因为这些信息并无帮助)。
使用Prism同时比较两条生存曲线
对于您想要比较的每一对组,请按照以下步骤操作:
- 从比较所有组的结果表开始。
- 在导航器中右键单击分析表,或在工具栏的“表格”部分单击“新建”按钮,并选择“复制当前表格”。
- “分析对话框”将会出现。在该对话框的右侧,选择您想要比较的两组,并确保所有其他组都未被选中。点击“确定”。
- “生粗你分析参数对话框”将会出现。不更改任何设置,点击“确定”。
- 记录P值(从对数秩或Gehan-Breslow-Wilcoxon检验中),但在您校正多重比较之前不要尝试解释这个P值
- 对每一组您想要进行的成对比较重复上述步骤。或者,打开“更改”菜单并选择“数据分析…”。“分析数据”对话框将会出现,您可以指定一组不同的组进行比较。
绘图技巧:生存曲线
如何计算数据
这些选择仅仅是偏好问题,而且非常直接:
- 绘制生存或事件发生情况?绘制生存情况更常见,它会生成一条在时间0时从100%开始,并随着时间增加而下降的曲线。绘制累计事件发生概率会生成一条在时间0时从0开始,并随着时间增加而上升的曲线。
- 绘制分数或百分比?生存概率可以在图表上以100%和0%之间的值报告,或者以0和1之间的分数报告,这种选择完全取决于个人偏好。
如何绘制数据
无误差线的图表
如下列所示,生存曲线通常使用阶梯线(而非连接各点的直线)绘制。阶梯中的每一步代表所绘制组的(一个或多个)感兴趣事件的发生。
在下图左侧,经过的观察时间被绘制为曲线上的刻度。对事件和删失观察都绘制了符号,但事件的刻度被曲线的垂直部分“隐藏”了。删失观察可以清楚地看到是沿曲线水平部分的刻度。这些数据包括在100天到150天之间处理组中的两个观察值。
右侧的图表将所有数据(事件和删失观察)绘制成圆圈,这样您可以看到每个个体。
带误差线的图表
显示误差线或置信区间可以使生存曲线更具信息性,但也会使图表更加杂乱,有时甚至更难阅读。左侧的图表显示了包含95%生存概率置信区间的阶梯形误差线。这显示了实际数据也以阶梯形式呈现,但每组的生存和误差线的重叠阶梯曲线使得阅读变得困难。右侧的图表显示了在每个绘制点提供生存概率标准误差的误差线。为了放置误差线叠加在阶梯曲线上,各点通过直线连接,而不是以阶梯曲线连接。
如何添加Y=50%的网格线以显示中位生存时间
添加一条位于Y=50(如果使用分数而非百分比,则为Y=0.5)的网格线。要做到这一点,双击Y轴以调出“格式轴”对话框。然后再标签底部,输入适当的Y坐标(50或0.5)并勾选添加网格线的框。点击“详细信息”按钮以对线条样式、粗细和颜色进行更改定制。
确定中位随访时间
生存分析通常涉及对不同受试者进行不同时长随访的实验设计。如何量化中位随访时间呢?生存分析(在Prism和其他程序中)会告诉您中位生存时间。但中位随访时间又是怎么回事呢?
请注意中位生存时间和研究对象被随访的中位时间之间的区别(本节主题)。
作为生存分析结果的一部分,Prism会提供一个包含处于风险中的受试者数量随时间变化的表格。一个想法是查看这个表格,看看数字减少到起始值一半所需的时间。但有两个原因导致不能简单地用处于风险中的数字下降确定时间:
- 一个受试者可能经历感兴趣的事件。
- 一个受试者的观察可能被删失。
Schempel和Smith提出了一个巧妙的方法,利用输入的生存数据来估计中位随访事件。其诀窍在于改变对感兴趣事件的定义。考虑一项研究,其中感兴趣事件实际上是失访(这种描述是有效的,因为这是一次性事件,任何在研究中失访的受试者都可能经历这种情况)。从这个七点来看,如果一个受试者经历了感兴趣事件,我们无法知道他们原本会被随访多长时间直到他们失访。为了从分析上研究这个想法,Schempel和Smith建议再次运行Kaplan-Meier分析,但改变状态指标的含义(用1表示失访或删失观察,用0表示受试者经历了来自原始研究的感兴趣事件)。当对这些改变后的数据进行Kaplan-Meier生存分析时,“中位生存时间”的含义实际上可以被解释为“中位失访时间”。换句话说,这就是中位随访时间!
在Prism中进行此操作的步骤如下:
- 从原始数据的生存分析结果中,点击“新建>复制当前表格”。
- 点击出现的“分析数据”对话框的“确定”。
- “参数:生存分析”对话框将出现。在此对话框中,交换指标变量。默认值是用1表示感兴趣事件,用0表示删失。在对话框中反转此惯例(但保留数据本身)。告诉Prism0表示感兴趣事件,1表示删失。
- 点击“确定”并查看结果页面。忽略对数秩检验及其P值,这些值无法解释。相反,查看“中位生存”的值。由于指标变量已交换,这个值实际上表示中位随访时间。
- 从此分析创建的Kaplan-Meier图跟踪随时间被随访的患者数量,它与跟踪生存概率随时间变化的Kaplan-Meier图不同。
对于比较两组的样本数据结果(经过一些润色)如下:
两组的中位随访时间均为130天。为了便于比较,这里是相同数据的生存曲线:
治疗组的中位生存时间为75天,而控制组的中位生存时间未定义(曲线未穿过50%生存概率线)。


雷达卡





京公网安备 11010802022788号







