元旦前在人民日报中央厨房上看到一篇文章,叫做“比肩辉瑞的国产新冠药物VV116,是这样研制和临床试验的”,想来就把文献原文找来读了读,写下本文分享给大家,本文主要关注文章的正文中主要统计设计(文章补充材料中还有很多值得学习的地方),前面的实验设计,包括盲法,纳排标准统统不在本文考虑,主要目的是让大家感受下NEJM的杂志的统计做法到底有多“难”。
研究原文链接如下:
https://www.nejm.org/doi/pdf/10.1056/NEJMoa2208822,点击即可阅读。
文章的主要样本入组流程如下:
假设
通过这个研究,作者想说明国产药不劣于辉瑞
The primary efficacy hypothesis was that VV116 would be noninferior to nirmatrelvir–ritonavir with respect to sustained clinical recovery
之前给大家写过,对于临床干预性研究样本量是一个非常非常非常重要的问题:我们首先要考虑清楚如果国产药真的真的不劣于辉瑞,那么需要有多少样本才能让我们在一次实验中很有把握(作者取了0.85)发现这种差异。
作者说了,要证明我这个药比辉瑞的好,那么我主要结局的HR95置信区间下限得大于0.8。意味着假设辉瑞药的康复时间是5.5天,那么我口服国产药康复时间一定要比6.875天快。那么就至少需要724个样本才能够真的不劣的时候有85%的可能得到阳性结果。
To satisfy the noninferiority hypothesis, the lower boundary of the two-sided 95% confidence interval for the hazard ratio of the primary end point had to be above 0.8. The noninferiority margin corresponds to a duration of 6.875 days to sustained clinical recovery, which is 25% longer than 5.5 days. A minimum of 724 events were required to ensure a statistical power of 85%.
怎么算的,这儿给大家来个演示
对于原假设HR界值为0.8的单侧检验,在R语言中生存数据的样本量计算函数nEvents中,设定阿尔法为0.025,单侧检验sided=1,两组样本比例为1,样本n=724,运行下面代码,将n设定为724,就可以保证达到统计效能power达到0.85:
作者是用EAST6这个软件算的,其实在R中都能搞定。
再看主要结果展示,主要结果展示很简单,没有花里胡哨的任何东西,就是非常简单的生存数据的描述统计,加上一个cox模型做出来的HR就完了。HR大于1说明国产药更好,因为结局是完全康复,结合HR的定义
我们知道其实是将辉瑞作为参考组得到的HR
The 95% confidence intervals were estimated with the use of normal approximation (Brookmeyer– Crowley method) on the basis of log–log transformation. Hazard ratios were calculated with the use of the Cox proportional-hazards model. A lower boundary of the two-sided 95% confidence interval for the hazard ratio of more than 0.8 was considered to indicate noninferiority (with a hazard ratio of >1 suggesting that participants receiving VV116 had a shorter time to sustained clinical recovery than those receiving nirmatrelvir–ritonavir).
文章的主要分析就给大家写完了,剩下还有很多生存数据的描述统计的结果在R中做起来都非常简单,之前也有写过。
以上就是主要统计结果展示,没了。很多描述统计和一个cox得到的HR。
看到这,相信你也感觉到了,主体文章的整个统计分析的做法就是一般小硕的水平,流病的本科生都能做,我这个业余选手也能做,如果你还做不来,多看几遍我之前发的文章你肯定也会做了,就这么简单。回过头来再想想你与NEJM差的是统计嘛?是写作吗?差的是做不来分析吗?是想不出来实验设计嘛?不是的,是资源,是思想,是你能不能在上海封控的时候调度7家定点医院的资源来做实验。所以优势资源的整合尤其重要,如果您需要一个强大的数据处理和分析资源请联系我!务必。
另外,本文中主要结局的评估工具新冠症状的评估表给大家放在下面,这应该算的上是最有科学性的新冠症状了,大家也可以用来评评自己和家人: