本文涵盖了Prism中可用的生存分析方法,包括Kaplan-Meier生存估计以及使用Cox比例风险回归进行生存分析。这两种方法截然不同,它们在各自的页面上都有详细的解释。
- 生存分析的基本概念
- Prism中的生存分析方法
- 如何进行Kaplan-Meier(非参数)生存分析
- Kaplan-Meier生存分析的结果
- 如何进行Cox比例风险回归
- Cox比例风险回归的结果
Cox比例风险回归的结果
本文将为您提供如何解读Prism为生存分析生成的结果的相关信息。
- 表格结果
- 个体值
- 基线值
- Cox比例风险回归的残差
- 估计生存曲线
个体值
在进行Cox比例风险回归后,模型会拟合预测变量与模型中的变量以及估计风险率之间的关系。
一旦模型确定,就可以为输入数据表中的每个原始个体观察提供额外信息。这些值可以在个体值选项卡的结果中找到,并且输入数据表中的行对应于个体值结果表中的行(观察顺序与输入数据表相同)。具体而言,对于每个个体观察,会报告以下值:
- 线性预测因子,XB:这是在输入估计的参数估计值和每个预测变量的值后计算得到的Σxi*βi值。这个值表示每个个体在估计对数(风险率)从基线风险的变化量。
- 风险比,exp(XB):这个个体的指数化线性预测因子(XB)。这是用于从基线风险率的乘法标量,或者是从基线累积生存道个体累积生存的变化量。Cox回归严重依赖于比例风险假设(即,任何个体的风险率与某些未知基线风险成比例)。这个相对风险值exp(XB)表示比例性(多少次更大或更小是这个特定个体相对于基线风险的风险)。
- 累积风险,H(t):这是模型在给定观察的失效时间(到时间t的总累积风险)时估计的个体累积风险。累积风险的较高值对应于估计累积生存概率的较低值。这个值对于许多数学/计算原因很重要(并且也包含在结果表中),但不容易直接解释。累积风险和累积生存之间的关系可以用以下公式表示:
- 累积生存,S(t):这是模型在给定观察的失效时间时估计的个体生存。这个值表示假设每个预测变量在该观察中具有相同值的情况下,个体生存到此时的概率。这个值是从基线生存函数,使用以下公式计算:
注意,使用上述两个方程,可以直接从基线生存函数和线性预测值(XB)计算出模型对个体累积危险度的估计值:
基线值
当进行Cox比例风险回归时,一个非常重要的目标可能是预测给定个体在被检查人群中的生存概率,前提是已知该个体的预测变量值。为了做到这一点,需要估计基线累积生存曲线和基线累积风险曲线。这些曲线的估计过程在数学上是复杂的,但可以大致按以下方式思考:
- 基线累积生存是所有预测变量值均为零的个体的估计累计生存。
- 基线累积风险是所有预测变量值均为零的个体的估计累积风险。
为了计算这些值,Prism首先必须计算一个称为α(alpha)的量。一般概念如下:
- 按失效时间的升序对输入数据中的观察值进行排序。
- 对于每个时间点,考虑个体的相对风险值(exp(XB)),这些个体是事件发生的个体以及那些在此时仍被认为“处于风险中”的个体(即那些尚未经历事件或在此时被审查的个体)。
- 使用事件发生个体和处于风险中个体的值的比率来计算α。
- 注意,根据定义,审查观察的α等于1。
一旦为每个时间点计算了α,计算基线累积生存和基线累积风险值就很直接,且不涉及复杂的数学:
即,在时间t的基线累积生存等于所有时间点(包括时间t)的所有α值的乘积。为了在Prism中确认这些结果,选择基线累积生存结果列中的一行。将此行的α值与之前所有行的α值相乘。这个乘积将于基线累积生存值相同。
基线累积风险的值可以通过以下公式计算:
在计算每个时间点的输入数据中的基线累积生存和基线累积风险后,Prism还将生成一个可以查看这些曲线的图表。在导航器中,选择与分析相关的图表,标题为“基线值:多次Cox回归”。默认情况下,基线累积生存将绘制在Y轴上,但双击图表将允许您访问格式图表对话框,并更改Y轴变量的分配以显示基线累积风险。
Cox比例风险回归的残差
在深入研究Prism报告的Cox比例风险回归残差的细节之前,必须指出这些残差并非经典意义上的残差。对于线性回归(多元线性回归或简单线性回归)和非线性回归,残差代表观察值与模型预测值之间的差异。
不幸的是,Cox比例风险回归中的残差并不采用这种定义。相反,Cox比例风险回归中的残差只是为了回答Cox回归中出现的许多相同问题而提出和使用的简单度量。经典残差可用于其他类型的回归。
比例风险假设是否有效?
这个问题是Cox比例风险回归分析的核心。一般思路是,每个个体在总体中发生感兴趣事件的时间由单一的潜在基线风险函数控制,并且每个个体在任何时间点的特定风险率只是这个基线风险率的简单缩略版本。另一种思考这个假设的方式是从估计的β系数的角度来看。为了使比例风险假设为真,这些参数估计必须随时间保持恒定。
观察值中是否存在异常值?
偏差残差(Deviance residuals)和鞅残差(Martingaleresiduals)可以与线性预测因子(XB)或风险比进行对比,以观察是否存在异常值。偏差残差和鞅残差都用于识别异常值,这些异常值可能是个体经历事件的时间比模型预测的更长或更短。对于这些残差,较大的正值表示个体经历事件的时间比模型预测的更长,而较大的负值表示个体经历事件的事件比模型预测的更短。鞅残差有一个理论上的最大值+1,但可以去取任意负值,导致可能看起来像异常值(存活时间比预测长的个体),但实际上可能不是异常值。因此,建议使用偏差残差。这些值更均匀地分布在零周围,正值和负值都有更均匀的分布。
预测变量是否线性?
Cox比例风险回归模型的另一个假设是对数(风险率)和参数估计之间存在线性关系。回想一下Cox比例风险回归模型:
或者等价地:
估计生存曲线
Cox比例风险回归分析参数对话框中的“图表”标签用于生成直观表示特定组随时间的估计生存概率的图表。需要注意的是,这些估计生存曲线是由分析中定义的模型生成的,并不代表使用Kaplan-Meier生存分析通过数据选择生成的生存曲线。
相反,这些生存曲线是使用Cox回归的关键假设生成的:特别是,任何个体(或由一组预测变量定义的个体组)的风险与某些基线风险成比例。这一假设的结果是,每个估计生存曲线都将具有相同的基本形状(包括它们在相同时间点都有“台阶”这一事实)。这是因为每个估计生存曲线都是使用基线生存计算的。给定具有特定预测变量集的个体/组的估计生存与基线生存之间的关系如下:
而不是使用参数估计,这个方程可以重写为使用每个预测变量的风险比:
本质上,这意味着对于给定个体或组(具有模型中预测变量的特定值集)的估计生存将始终与基线生存成比例地高或低。改变预测变量的值永远不会改变估计生存曲线的整体形状,只有改变新估计生存曲线与确定的基线生存曲线的比例。
当指定Prism用于生成估计生存曲线的预测变量时,有两个概念需要记住:
- 如果未指定预测变量,估计生存曲线是在该变量取其基线值的假设下生成的。
- Prism将自动确定所有指定预测变量值的可能组合,并为每个组合生成估计生存曲线。
考虑一个将年龄作为连续预测变量(未对数据进行中心化处理)的模型。该变量的基线值为零(因为它是连续的)。在生成估计生存曲线时,如果未指定年龄的值,生成的曲线将代表年龄为零时的估计生存情况。在大多数情况下,这可能不太有意义。因此,如果在模型中识别出一个连续变量是重要的预测因子,则在指定估计生存曲线时应考虑该变量值。
当使用分类变量来指定估计生存曲线时,可能有许多不同的水平组合可以定义不同的组。考虑两个分类变量:
- 性别,两个水平:“女性”和“男性”
- 治疗组,三个水平:“对照组”、“标准治疗组”和“实验治疗组”
[size=14.6667px]
使用这两个分类变量,可以定义六个不同的组:
- 对照组中的女性
- 标准治疗组中的女性
- 实验治疗组中的女性
- 对照组中的男性
- 标准治疗组中的男性
- 实验治疗组中的男性
而不是手动定义所有者六种组合,只需在参数对话框中选择这两个变量(以及每个变量的适当水平),Prism将自动确定图表所需的个体估计生存曲线的数量。在上述实例中,添加一个具有“低”、“中”和“高”水平的血糖浓度第三个变量将使组合总数增加到18。但使用Prism,您只需选择三个变量(和水平),而无需手动指定所有18中不同的组合。


雷达卡






京公网安备 11010802022788号







