生存分析(Survival Analysis)是对一个或多个非负随机变量进行统计推断,研究生存现象和响应时间数据及其统计规律的一门学科。
关键概念—“生存曲线”
在许多临床和动物研究中,结果是生存时间。研究目的是测定治疗是否会改变生存率。Prism使用“Kaplan—Meier法”(即乘积极限法)创建生存曲线,并使用对数秩检验和Gehan - Wilcoxon检验比较生存曲线。
01 删失数据(Censored data)
创建生存曲线其实比想象中要困难。这个困难在于很难清楚地了解各受试者的生存时间。比如,
- 在研究结束时,一部分受试者可能并没有死亡。 你知道到目前为止他们的寿命,但是不清楚会到什么时间结束;
- 有部分受试者中途退出了该项研究。如搬到另座城市、或想要服用现有方案禁止的药物。 这种情况下,你了解这些受试者其实在你的研究中存活了一段特定的时间,但不了解在此之后他们的寿命会到什么时间结束(即使了解也无法使用这些信息。因为他们未遵循既定的实验方案);
在以上两种情况下,这些受试者的信息均视为“删失(Censored)”。
通常我们不希望直接从分析中删除这些“删失”的观察结果,但需要正确地解释这些数据。我们需要正确的理解“删失(Censored)”的含义,它意味着“不清楚”,或“无法使用超出特定点的生存时间”。Prism在创建和比较生存曲线时,会自动考虑“删失数据”。
02 不仅仅是针对“生存(Survival)”
“生存曲线(Survival Curve)”一词会有点限制性,因为结果可以是任何定义明确的“终点”,每个受试者只能发生一次。除死亡外,终点也可以是血管移植物的闭塞、肿瘤的首次转移或移植肾的排斥。也并非都是可怕的类型,也会包含如肾功能恢复、出院或毕业等。
03 分析其他类型的生存数据
使用非线性回归可以更好地分析其他类型的生存数据。 举个例子,本篇中描述的方法不适合分析细胞存活曲线,该曲线绘制的存活百分比(Y)是各种剂量辐射(X)的函数。
注意:本篇描述的生存分析方法仅在X为时间时有用,且需要知道每名受试者的生存时间。
04 比例风险(Cox)回归
Prism内置的分析可以比较两组或更多组的生存曲线。 但这些方法(对数秩检验,Gehan-Breslow-Wilcoxon检验)无法处理匹配组中受试者的数据,或还希望调整年龄、性别或其他变量的情况。 对于此类分析,需要使用比例风险回归,而Prism不采用该程序。
如何通过Prism进行生存分析?
01 创建“生存”图表
从“欢迎(Welcome)或新建表格(New Table)”对话框中,选择“生存(Survival)”选项卡。如果你还没有准备好输入自己的数据,可以使用样本数据,并选择其中一个样本数据集。
02 输入“生存时间(survival times)”
按照下列要求,在表格中输入每个受试者:
- 在X列中输入受试者“删失”或死亡(或正在跟踪的任何事件)的时间。可以使用任何方便的单位,如几天或几个月。 时间零点不必是某个指定的日历时间,而是定义为每个受试者进入研究的日期。所以不同的受试者会有不同的日历时间。 在一些临床研究中,时间零点跨度数个日历年。持续时间必须以数字的形式输入,并且不能直接输入日期(或者输入行标题以标识每个受试者);
- 在Y列中输入“1”,表示在X列中显示受试者死亡(或事件发生)时间的行。在当时删失受试者的 行 中输入“0”。生存研究中的每个受试者要么死亡,要么删失;
- 将每个治疗组的受试者输入到不同的Y列。 将第一组受试者的X值录入到表格顶部,Y代码放在第一个Y列中;
- 将第二组受试者的X值放在第一组受试者的X值下面(不必对X值进行排序,并且X列可能包含多个相同的值);
- 将相应的Y代码放在第二个Y列中,将第一列留空。
在下面的示例中,在前14行中输入了A组的数据,在第15行中输入了B组的数据。
