楼主: kedemingshi
1873 46

[量化金融] 临床试验中的P-hacking和激励如何影响分布 [推广有奖]

41
mingdashike22 在职认证  发表于 2022-6-24 06:24:45
这种不均匀性阻止了对大部分数据的机械评估,即使使用自然语言处理算法也是如此。因此,我们不得不手工对数据进行编码(如我们用于连接各阶段试验的第二阶段试验的主要干预),或将注意力限制在数据库中所有试验统一编码的特征上。后者是仅允许特定数量答案(如二进制变量)的数值透镜或条目。我们根据与治疗条件相关的网格项对试验进行分类,并将它们跨阶段连接起来。MeSH同义词库是由美国国家医学图书馆(NationalLibrary of Medicine)编制的受控词汇列表,用于索引、编目和搜索生物医学和健康相关信息。网格分类由ClinicalTrials提供。基于自然语言处理算法的ZF管理员。图S1:稳健性检查:在z=1.96的密度不连续性测试中,大型和小型行业赞助商的56个不同定义的p值直方图。在z=1.96时,主要结果构建的z-统计量密度的不连续性检验[38]得出的p值。垂直虚线表示p=0.05。行业赞助试验的样本根据大型赞助商的56种不同定义进行划分。这些定义由银行赞助者根据其2018年收入、2018年处方药销售额、2018年研发支出以及向注册中心报告的试验数量获得。对于这四个标准中的每一个,都创建了14个不同的“大与小”定义:前七个与剩余、前八个与剩余,依此类推,直到前二十个与剩余。补充案文提供了进一步的细节。无花果

42
何人来此 在职认证  发表于 2022-6-24 06:24:48
S2:稳健性检查:大型和小型行业赞助企业的密度不连续性测试,转换为单侧测试分数。第二阶段(蓝色虚线)和第三阶段(灰色实线)试验主要结果的构建单边DZ统计的密度估计。阴影区域为95%置信区间,1.64处的垂直线对应于0.05水平的统计显著性阈值。样本量:A:n=1332(第二阶段),n=1424(第三阶段);B: n=1450(第二阶段),n=1520(第三阶段)。不连续性测试的显著水平【38】:*p<0.1;**p<0.05;***p<0.01;表S4中报告的精确p值。图S3:第二阶段和第三阶段z分数分布的比较,以及次要结果z=1.96时的不连续性检验,取决于牵头发起人的责任。第二阶段(蓝色虚线)和第三阶段(灰色实线)试验次要结果测试中构建的z统计量的密度估计。阴影区域为95%置信区间,1.96处的垂直线对应于0.05水平的统计显著性阈值。样本:A:n=17840(第二阶段),n=25050(第三阶段);B: n=2553(二期),n=2102(二期);C: n=8579(第二阶段),n=11480(第三阶段);D: n=6672(二期),n=11486(二期)。不连续性测试的显著水平【38】:*p<0.1;**p<0.05;***p<0.01;表S5中报告的exactp值。图S4:第二阶段和第三阶段z分数的核密度估计,以及解释选择性延续的构建反事实,取决于牵头发起人的关联。仅基于精确报告的p值(即不作为不等式)估计密度。简写法:Ph2=第二阶段,Ph3=第三阶段,SC=选择性延续。

43
kedemingshi 在职认证  发表于 2022-6-24 06:24:51
样本量:A:n=4135(第二阶段),n=5957(第三阶段);B: n=2181(第二阶段),n=3209(第三阶段);C: n=1954(第二阶段),n=2748(第三阶段)。表S2:z=1.96阈值下密度不连续性试验的P值。(1) (2)发起人第二阶段第三阶段All 0.09*0.00***(3953)(3664)非行业0.23 0.35(1171)(720)所有行业0.30 0.52(2782)(2944)小型行业0.20 0.032**(1450)(1520)前十大行业0.91 0.67(1332)(1424)注:主要结果的P值来自密度不连续性测试[38],详见补充文本;显著水平:*p<0.1;**p<0.05;***p<0.01。Parentheses中的样本大小。表S3:对于行业赞助的III期试验,在显著阈值以及atz=2.01和z=2.46时,z密度的不连续性大小。(1) (2)(3)发起人\\截止值z=1.96 z=2.01 z=2.46所有行业0.031 0.087**0.11*小行业0.166**0.056 0.177**前十大行业0.029 0.075 0.015注:主要结果的密度不连续性测试[38]导致的各截止点左右偏差修正密度估计值的差异,详细说明见补充文本。样本量:所有行业n=2944,小型行业n=1520,前十大行业n=1424。显著水平:*p<0.1;**p<0.05;***p<0.01。表S4:稳健性检查-单侧测试分数的转换:z1处密度不连续性测试的P值-侧面=1.64阈值。(1) (2)发起人第二阶段第三阶段ISMALL行业0.20 0.076*(1450)(1520)前10名行业0.31 0.74(1332)(1424)注:主要结果的P值来自密度不连续性测试[38],详细说明见补充文本;显著水平:*p<0.1;**p<0.05;***p<0.01。

44
何人来此 在职认证  发表于 2022-6-24 06:24:54
Parentheses中的样本大小。表S5:z=1.96阈值下密度不连续性试验的P值-次要结果。(1) (2)发起人第二阶段第三阶段IALL 0.54 0.21(17804)(25050)非行业0.34 0.35(2553)(2102)所有行业0.34 0.07*(15251)(22948)小型行业0.87 0.06*(6672)(11468)前十大行业0.44 0.36(8579)(11480)注:次要结果的P值来自密度不连续性测试[38],详见补充文本;显著水平:*p<0.1;**p<0.05;***p<0.01。Parentheses中的样本大小。表S6:基于次要结果的选择性延续logit选择函数估计值。(1) (2)(3)赞助所有排名前10位的小型工业工业工业第二阶段z得分0.109*0.197**-0.0612(0.0557)(0.0839)(0.0674)第二阶段z得分的假人报告为“z>3.29”0.465 0.600 0.0737(0.416)(0.628)(0.461)第二阶段z得分的假人报告为“z>3.89”0.512 0.279 0.779**(0.353)(0.395)(0.351)平均因变量0.353 0.360 0.347控制是是是是鱼的状况已修复影响是是是完成年份固定影响是是观测17724 7502 10222否。试验720 402 318注:观察单位:试验结果;包括对照组:总体登记的平方根和安慰剂对照组的假人。条件固定效应的分类基于与试验相关的医学主题词(MeSH)术语【21】;有关更多详细信息,请参阅补充文本。

45
大多数88 在职认证  发表于 2022-6-24 06:24:58
Parenthes中的标准误差在网格条件级别聚集;显著性水平(基于双侧t检验):*p<0.1;**p<0.05;***p<0.01。表S7:基于选择的第二阶段和第三阶段主要结果的显著结果差异分解,取决于牵头发起人的责任。重大成果份额(1)(2)(3)赞助所有小型前10大产业[Ph2]0.481 0.499 0.460(0.0205)(0.0226)(0.0319)[Ph3]0.721 0.757 0.679(0.0149)(0.0136)(0.0245)[Ph2+SC]0.604 0.573 0.645(0.0316)(0.0406)(0.0458)差异(4)(5)(6)赞助所有小型前10大产业[Ph3]-[Ph2]0.241***0.258***0.219***(0.0259)(0.0256)(0.0422)[Ph3]-[Ph2+SC]0.117***0.184***0.0339(0.0354)(0.0426)(0.0529)[Ph2+SC]-[Ph2]0.123***0.0746**0.185***(0.0260)(0.0347)(0.0410)观测10092 5390 4702观测Ph2 4135 2181 1954观测Ph3 5957 3209 2748否。试验Ph2 1244 732 512否。试验Ph3 2655 1544 1111注:第1-3列显示基于核密度估计和选择调整的重要结果份额,简写为Ph2=第二阶段,Ph3=第三阶段,SC=选择性延续。第4-6列显示了这些共享的差异。

46
可人4 在职认证  发表于 2022-6-24 06:25:01
括号中的标准误差是通过对整个估计过程(500次重复,在试验水平上聚集)进行自举得到的;显著性水平(基于双侧t检验):*p<0.1;**p<0.05;***p<0.01。表S8:网状条件固定效应的类别,市场规模由医疗保险总支出确定。2011年MeSH医疗保险Dcode类别支出总额为10亿美元C14心血管疾病13.215F03精神疾病12.336C18营养和代谢疾病8.957C19内分泌系统疾病8.45C10神经系统疾病5.956C08/C09呼吸道疾病/耳鼻咽喉疾病5.945C06消化系统疾病4.377C05肌肉骨骼疾病2.888C04肿瘤2.64C12/C13男性泌尿生殖系统疾病/2.262女性泌尿生殖系统疾病和妊娠并发症20免疫系统疾病1.355C23病理条件、体征和症状0.812C17皮肤和结缔组织疾病0.683C25化学诱导疾病0.17C16先天性、遗传性和新生儿疾病和异常0.101注:补充文本中提供的计算详情。参考51。Cattaneo,M.D.、Jansson,M.&Ma,X.基于密度不连续性的操纵测试。Stata J.18,234–261(28)(2018年)。52、美国食品和药物管理局。药物开发过程。https://www.fda.gov/ForPatients/Approvals/Drugs/ucm405622.htm (2018).Wood,A.J.临床试验注册的进展和不足。N、 英语。J、 医学。360, 824–830 (2009).Zarin,D.A.、Tse,T.、Williams,R.J.&Carr,S.《临床试验中的试验报告》。gov–最终规则。N、 英语。J、 医学。375, 1998–2004 (2016).Anderson,M.L.等人,《临床试验结果报告的依从性》。英国政府。J、 医学。372, 1031–1039 (2015).Piller,C.&Bronshtein,T。

47
kedemingshi 在职认证  发表于 2022-6-24 06:25:04
面对公众压力,研究机构加强了临床试验结果的报告。统计(2018年1月8日)https://www.statnews.com/2018/01/09/clinicaltrials-reporting-nih/ (2018).Piller、C.FDA和NIH让临床试验赞助者对结果保密并违反法律。科学内政部:10.1126/science。aba8123(2020年1月)。Zarin,D.A.、Tse,T.、Williams,R.J.、Rajakannan,T.&Fain,K.M.临床试验评估。2017年9月(2017年),伊利诺伊州芝加哥,第八届国际同行评议大会和科学出版物中的政府成果数据库及其与同行评议文献的关系。Sekeres,M.等人,《临床试验登记册中科学领导力信息的报告不佳》。《公共科学图书馆综合》第3、1-6期(2008年)。60、Mathieu,S.、Boutron,I.、Moher,D.、Altman,D.&Ravaud,P.随机对照试验中注册和公布主要结果的比较。Jama 302977–984(2009)。Ramagopalan,S.等人,《在临床试验中登记的临床试验中主要结果变化的患病率》。gov:一项横断面研究。F1000Research 3(2014)。62、Ross,J.S.,Mulvey,G.K.,Hines,E.M.,Nissen,S.E.&Krumholz,H.M.临床试验注册后的试验出版物。gov:横截面分析。Plos医学院。6, 1–9 (2009).Zarin,D.A.和Tse,T.在试验报告系统(TRS)的背景下共享个人参与者数据(IPD)。Plos Med-。13, 1–8 (2016).Dickersin,K.和Mayo Wilson,E.设计和测量标准将使临床研究具有可复制性和可用性。过程。自然的。Acad。Sci。美国115,2590–2594(2018)。65、Christel,M.2019 Pharm Exec 50。制药执行官39,12–19(2019年6月)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-31 20:54