楼主: 大多数88
1784 41

[经济学] 二元分类测试、不完善的标准和模棱两可的 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-4-26 15:11:43
对于已建立的测试,如果普适性和P(y=1)已知,则可以通过贝叶斯规则从特定性和敏感性获得这些测量值:PPVy:=P(x=1 | y=1)=pP(y=1 | x=1)=pP(y=1)σNPVy:=P(x=0 | y=0)=1- pP(y=0)P(y=0 | x=0)。由于受试者通常不能代表整个人群,即使对于已建立的测试,这两个指标也没有点识别(Manski和Molinari,2021;Manski,2020;Stoye,2020),为了简化分析并符合SARS-CoV-2测试的应用,我还考虑了以下三个基线假设。假设2(已建立的测试没有假阳性)。人口满意度(x=0,y=1)=0。此外,(未)被测试的以下逻辑含义成立:(i)t=0==>z=0和(ii)z=1==> t=1。请注意,即使未经测试,y=1也是可能的,因为参与工具只涉及新的测试。等效地,数据由新试验相对于已建立试验的灵敏度和特异性以及关于有多少已建立或新试验具有阳性结果的附加信息给出。例如,为了得到有意义的结果,可能会对疑似感染者进行过度采样。假设2意味着已建立的测试达到了1的最大规格和PPVyof。此外,我将假设测试的恶名与曼斯基和莫利纳里(2021)一样,这意味着在接受测试的条件下,被感染的概率比不接受测试的概率更大。假设3(测试单调性)。人口满意度P(x=1 | t=1)≥P(x=1 | t=0)。最后,我假设已建立的测试的敏感性确实取决于潜在的健康状态x,但不取决于该人是否在测试池t=1。假设4(健康支持)。

12
大多数88 在职认证  发表于 2022-4-26 15:11:49
人口满意度P(y=1 | x=1,t=1)=P(y=1 | x=1)=σ。为了减少下面繁琐冗长的符号,我将使用这个简化的符号:γ:=P(y=1 | t=1)。已确定的t试验ζ的试验产率:=P(z=1 | t=1)。试验产量f或新试验τ:=P(t=1)。数据代表性的度量。为了避免不重要的情况,假设γ,ζ,τ>0。注意,τ与inManski和Molinari(2021)或Stoye(2020)的解释略有不同。这里,τ=1表示dat a P(y,z | t=1)完全代表了总体人口。特别是,这样的参数值意味着没有对受感染的参与者进行过采样。特别是,即使参与池很小(通常情况下),这并不意味着τ应该接近零。用这种表示法,我们得到了P(z=1)=τζ,因为只有当受试者接受检测时,新检测才呈阳性。此外,假设2与假设4相结合,这是因为P(x=0,y=0)=P(x=0,y=0)+P(x=0,y=1)=P(x=0)=1- pand P(x=1,y=1)=P(x=1,y=1)+P(x=0,y=1)=P(y=1)。如果自愿加入测试池,这可能不是真的。然而,为了确定新测试的准确性,这种假设似乎经常适用。见脚注17。回想一下,新测试获得了测试池。例如,如果为测试池执行既定测试的医务人员不小心,可能会违反这一假设。在这种情况下,已建立的测试可能对测试池更敏感。参见脚注17,了解为什么这样的假设可能有问题。一个小的参与池可能会恶化统计推断问题:假设参与池完全具有代表性,但很小。

13
mingdashike22 在职认证  发表于 2022-4-26 15:11:57
在这种情况下,τ=1,但推断通常依赖于某种中心极限定理,这在这种情况下并不合适。然而,回想一下,我已经远离了上面提到的推理问题。8.2.1已建立的试验给出了P(x=1 | t=1)=γ/σ。然后,总概率定律和假设3给出了p的尖锐边界∈ [τγ/σ,γ/σ] =:χ, χ因为:=P(x=1)=P(x=1 | t=1)|{z}=γστ+P(x=1 | t=0)|{z}∈[0,γσ]根据假设3(1)- τ).反过来,敏感性σ和假设2:P(y=1)=Pσ暗示了已建立测试总体阳性率的界限∈ [τγ, γ].因为我们考虑了p的非平凡情况∈ (0,1),数据与保持的假设的一致性要求建立的测试对besu效率高的敏感性,即γ<σ≤ 1.反过来,假设意味着P(y=1)∈ (0,1)。2.1已建立的试验假设2暗示了已建立的试验(PPVy=1)的完美阳性预测值。然而,负面预测值仅部分确定,命题1提供了明确的界限。提议1。在假设1–假设4下,建立ed检验的负预测值急剧有界,如下所示:∈σσ - γ1 - γ,σσ - τγ1 - τγ.证据固定α=P(y=1)∈ [τγ,γ]和定义患病率作为αbyPα(x=1)=α/σ的函数。n nPvy(α)=1- Pα(x=1)1- αP(y=0 | x=0)|{z}=1,假设2=σσ- α1 - α自σ- α ≤ 1.- α代表所有α∈ [τγ,γ],NP Vy(·)正在减少。因此,NPVy∈[NPVy(γ),NPVy(τγ)]。有了它,就可以分析已建立的测试的信息可靠性。表2总结了观察既定测试结果前后的患病率,这是定义信息性的相关指标(见图1)。

14
mingdashike22 在职认证  发表于 2022-4-26 15:12:03
从形式上讲,已建立的测试是一种扩张,如果每一种可能的普遍性∈ [χ,χ]是P(x=1 | y=1)=ppv的一个可能值,P(x=1 | y=n集的一个界称为sharp,如果该界本身是该集的一个成员。0)=1- NPVy。显然,由于坚持假设,阳性测试结果提供了完美的知识。因此,建立的测试不能是一种扩张。另一方面,否定结果降低了否定结果的普遍条件的上下限,因为τγ≤ γ < σ.此外,任何测试结果的间隔宽度都缩小了两个测试结果的流行条件的可能值集。从这个意义上说,建立的测试不仅是信息性的(即,不是扩展),而且在测试结果为阴性后,还严格缩小了可能的普遍值集的大小。表2:测试前已确定的测试P(x=1 |·)下限上限区间宽度τγσγσγσ(1)的信息性- τ) 阳性结果(y=1)10阴性结果(y=0)τγσ1-σ1-τγγσ1-σ1-γγσ1-τ1-τγ1-σ1-γ备注:第二行对应于Ppv,第三行由1给出- NPVy。众所周知,为了应用贝叶斯规则获得NPV,需要了解患病率。由于在大多数应用中,患病率是未知的,一种常见的做法是假设一个给定的患病率水平。例如,美国食品和药物管理局(FDA,2020b)假设PPV和NPV的患病率为5%。如果将这样一个假设(p=χ)加到保持的假设中,那么p(y=1)=χσ,进而p(y=1 | t=0)=χσ-γτ1-τ.这一附加假设允许准确确定已建立测试的NPVas1-χ1-因此P(x=1 | y=0)=χ1-σ1-χσ.

15
大多数88 在职认证  发表于 2022-4-26 15:12:10
因此,这一附加假设不仅排除了关于患病率的模糊性,而且还表明,已建立的测试本身并没有提供模糊的美国信息。在非负性试验结果(参见表2)或NPV(参见命题1)后,在非平凡的患病率区间内反映出的明显模糊性,只是患病率模糊性的一种表现,但并非由于试验本身。当然,这一点必须成立,因为总体生育能力定律在点上成立。检测结果呈阳性是显而易见的。对于负面结果,请注意宽度严格增加当且仅当1- σ > (1 - γ)(1 - τγ),相当于τ(1+γ)>σγ+1≥ 2.导致矛盾。或者,我们可以放弃P(t=1)=τ是精确已知的假设。在这种情况下(并且允许P(y=1 | t=0)∈ [0,γ]与一般情况一样)假定的患病率界限τ。计算表明τ∈h0,χσγi。由于下限始终为τmin=0,我们认为这种情况不太有趣。从技术上讲,已建立的测试是一个Labackwell(1951)的实验,其中灵敏度和特异性可以被视为将(健康)状态映射到信号分布的函数(即测试结果)。正如引言中提到的,这意味着在这些假设条件下,已建立的测试的信息值(弱)为正。10.2.2新的测试2。2.新测试接下来,分析新测试的信息量。首先,我将仅基于测试人群讨论信息性。对于这一亚群体,患病率由χ=γ/σ给出,因此关于患病率的模糊性被减弱。第2.4小节将分析扩展到新测试对总体人口的信息性。

16
mingdashike22 在职认证  发表于 2022-4-26 15:12:16
对于测试人群,相关的测量值是正预测值(PPV)和负预测值(NPV),但现在它们也取决于被测试:PPVz:=P(x=1 | z=1,t=1)=P(x=1,z=1 | t=1)P(z=1 | t=1)=P(x=1,z=1 | t=1)ζNPVz:=P(x=0 | z=0,t=1)=P(x=0,z=0,t=1)- ζ.为了获得这些度量,需要分布P(x,z | t=1)。对于固定τ,使用Joe(1997)的结果,该结果提供了与数据P(x,y | t=1)兼容的所有可能联合分布P(x,y,z)(参见附录a)。在这种结构中设置τ=1,可以得到可能的分布P(x,y,z | t=1)。最后,P(x,z | t=1)是由边缘化引起的。为了简化代数表达式,有必要区分表3中定义的四种情况。通过确定已建立测试的灵敏度σ,测试数据P(x,y | t=1)立即揭示了测试所属的情况。图2显示了后面考虑的三个试验(StQ、BiN、CT)和三个假设试验(包括表1中的扩张试验)的结果。当σ→ 1,那么除了信息性案例(I)之外的所有案例都不再相关。对于SARS-CoV-2检测抗原测试,世卫组织建议最低规格接近一个。图2中(顶部钻机ht)边界的测试满足该标准。因此,对于大多数应用,要么是证实性的(如果σ<1),要么是信息性的(如果σ<1)≈ 1) 将会是更高的。与已建立的测试相比,新测试的PPV可能小于1,并且通常只识别集合。集合识别的原因是没有直接观察到P(x,z | t=1)。

17
mingdashike22 在职认证  发表于 2022-4-26 15:12:22
如上所述,存在与数据一致的多重分布P(x,z | t=1),每个分布导致潜在的不同PPV。命题2为PPV值建立了清晰的识别集。CT、Uni和Anti不满足世卫组织97%最低规格的最低要求。表3:与两个测试有关的案例案例案例名称参数限制(C)P(y=0,z=0 | t=1)≥ max{χ(1)- σ), 1 - χ} 资料性(一)1-χ>P(y=0,z=0 | t=1)≥ χ(1 - σ) 非信息性(U)χ(1)- σ) P(y=0,z=0 | t=1)≥ 1.- χ(X)min{χ(1)- σ), 1 - χ} >P(y=0,z=0 | t=1)召回χ=γ/σ是患病率的上限,γ=P(y=1 | t=1)是确定的检验结果。γP(y=0,z=0 | t=1)σ1- σStQDilBiNCTUniAnti(I)(C)(X)(U)图2:用σ=0.75说明我们的情况:Uni是一个对应于均匀分布P(y,z | t=1)=1/4的测试。Anti总是产生与已建立测试P(y=1,z=0 | t=1)=P(y=0,z=1 | t=1)=1/2相反的结果。StQ、BiN和CT是第3章后面研究的真实测试。Dil是表1给出的膨胀试验。提案2(PPV)。在假设1、假设2和假设4中,新测试的阳性预测值为isPPVz∈[P(y=1 | z=1,t=1),1]在(C)情况下,hP(y=1 | z=1,t=1),P(y=1 | z=1,t=1)+χ1-σζiin情况(I)h1-1.-χζ,1在(U)h1情况下-1.-χζ,P(y=1 | z=1,t=1)+χ1-σζiin案例(X)。12 2.2新的测试证明。t=1的条件与τ=1的条件相同。

18
kedemingshi 在职认证  发表于 2022-4-26 15:12:29
因此,从表20和表21中,我们分别得到:P(x=1,z=1 | t=1):=P(y=1,z=1 | t=1)+max0,P(y=0,z=1 | t=1)- (1 - χ) |{z}=χ-γ-P(y=0,z=0 | t=1)P(x=1,z=1 | t=1):=P(y=1,z=1 | t=1)+min{χ,1- P(y=0,z=0 | t=1)}- γ=min{χ,1- P(y=0,z=0 | t=1)}- P(y=1,z=0 | t=1)=minχ - P(y=1,z=0 | t=1)|{z}=χ-γ+P(y=1,z=1 | t=1),ζ.现在,请注意- γ = χ(1 - σ) 除以ζ得到PPV。为了避免部分确定的预测值,新测试的这些测量通常被报告为参考测试是完美的。在这种情况下,仅数据P(y,z)就提供了一个独特的预测值:推论1(完美黄金标准-PPV)。假设假设1、假设2和假设4成立。如果σ=1,即已建立的测试具有完美的灵敏度,那么Pvz=P(y=1 | z=1,t=1)。证据如果σ=1,那么χ=γ=P(y=1 | t=1)。因此,相关案例为(I)。因此,下界是P(y=1 | z=1,t=1),上界是isP(y=1 | z=1,t=1)+γζ1- σ∑|{z}=0。我们之前看到,已建立的测试总是达到一个最大PPV,因此,如果它提供了一个积极的结果,会提供大量信息。新测试的阳性结果信息量有多大?为了回答这个问题,请注意,由于我们的条件是接受测试,因此之前不存在不确定性,因为测试poo l的值由χ给出。即使没有这种先前的模糊性,测试结果也存在模糊性。例如,在确认案例(C)中,PPVzis 1的可能值的区间宽度- P(y=1 | z=1,t=1),在应用中通常很小但不为零。

19
可人4 在职认证  发表于 2022-4-26 15:12:36
因此,至少在检测结果呈阳性后,从新检测中获得的信息对我们来说是模糊的。在这里和下面,我将使用Pto表示下界分布,P表示上界。从技术上讲,一个可能在案例(C)或(U)的边界上,但通过C连续性,结果边界不会改变。这一观察结果本身就意味着这项测试不是一项实验。与推导PPV类似,可以推导出新测试的灵敏度。与第2.1节中讨论的既定测试相比,新测试的模糊性允许出现扩张。在当前设置中,如果χ=P(x=1 | t=1)包含在两个集合的相交处,则会发生膨胀,每个测试结果的P(x=1 | y=i,t=1)可能值∈ {0, 1} . 在阳性测试结果之后,P(x=1 | y=1,t=1)的一组可能值是否可能包含在χ=P(x=1 | t=1)中?推论2提供了完整的特征化。随后将讨论阴性测试结果后的相应情况。推论2(界限增加-PPV)。假设1、假设2和假设4成立。新测试的PPV可能值包含χ=P(x=1 | t=1),如果只有σ时才包含d≤ 闵γ(1 - ζ) P(y=1,z=0 | t=1),γζP(y=1,z=1 | t=1),其中,第一个入口对应于上限的增加,第二个条件确保下限的减少。证据对于上限,请注意,只有当且仅当发生(I)或(X)情况(即1)时,才能出现严格的下降-χ>P(y=0,z=0 | t=1)和P(y=1 | z=1,t=1)+χ1-σζ< χ. 第一个等于σ>γ1-P(y=0,z=0 | t=1)和第二个σ>1-ζP(z=0 | y=1,t=1)=γP(y=1 | z=0,t=1)。

20
kedemingshi 在职认证  发表于 2022-4-26 15:12:45
因为P(y=0,z=0 | t=1)≤ P(y=0 | z=0,t=1)我们也有P(y=1 | z=0,t=1)≤ 1.- P(y=0,z=0 | t=1)。因此,当且仅当σ>γP(y=1 | z=0,t=1)时,才会发生严格的下降。对于下限,请注意1-1.-χζ≤ χ总是成立的。对于其他情况(C和I,即P(y=0,z=0 | t=1)≥χ(1 - σ) 严格增加isP(y=1 | z=1,t=1)>χ,相当于σ>γP(y=1 | z=1,t=1)。其中,情况条件等于σ≥γ1-P(y=0,z=1 | t=1)。与上面类似,P(y=1 | z=1,t=1)≤ 1.- P(y=0,z=1 | t=1),因此只有当σ>γP(y=1 | z=1,t=1)时,才会出现严格的增加。如果测试数据不符合独立分布,则圆2的不等式就变得非常重要,这在大多数应用中都是如此。在这些情况下,当违反了循环2的非平凡不等式时,就不会发生膨胀。它仍然需要分析阴性测试结果中包含的信息。命题3为TOO的负预测值建立了清晰的界限。因此,(健康)状态与信号分布(测试结果)之间存在对应关系。14 2.2新测试新测试。这是分析消极测试结果信息量的相关度量。提案3(NPV)。在假设1、假设2和假设4中,新测试的阴性预测值为NPVZ∈hP(y=0 | z=0,t=1)-χ1-σ1-ζ,1-χ1-ζiin情况(C)hP(y=0 | z=0,t=1)-χ1-σ1-ζ、 P(y=0 | z=0,t=1)在(I)h0,1情况下-χ1-ζiin case(U)[0,P(y=0 | z=0,t=1)]in case(X)。证据t=1的条件与τ=1的条件相同。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 02:13