楼主: 大多数88
1784 41

[经济学] 二元分类测试、不完善的标准和模棱两可的 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
71.0197
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-4-26 15:10:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Binary Classification Tests, Imperfect Standards, and Ambiguous
  Information》
---
作者:
Gabriel Ziegler
---
最新提交年份:
2021
---
英文摘要:
  New binary classification tests are often evaluated relative to a pre-established test. For example, rapid Antigen tests for the detection of SARS-CoV-2 are assessed relative to more established PCR tests. In this paper, I argue that the new test can be described as producing ambiguous information when the pre-established is imperfect. This allows for a phenomenon called dilation -- an extreme form of non-informativeness. As an example, I present hypothetical test data satisfying the WHO\'s minimum quality requirement for rapid Antigen tests which leads to dilation. The ambiguity in the information arises from a missing data problem due to imperfection of the established test: the joint distribution of true infection and test results is not observed. Using results from Copula theory, I construct the (usually non-singleton) set of all these possible joint distributions, which allows me to assess the new test\'s informativeness. This analysis leads to a simple sufficient condition to make sure that a new test is not a dilation. I illustrate my approach with applications to data from three COVID-19 related tests. Two rapid Antigen tests satisfy my sufficient condition easily and are therefore informative. However, less accurate procedures, like chest CT scans, may exhibit dilation.
---
中文摘要:
新的二元分类测试通常相对于预先建立的测试进行评估。例如,用于检测SARS-CoV-2的快速抗原试验是相对于更成熟的PCR试验进行评估的。在本文中,我认为新的测试可以被描述为当预先建立的测试不完美时产生模糊信息。这就产生了一种叫做膨胀的现象——一种非信息性的极端形式。作为一个例子,我给出了满足世卫组织快速抗原检测最低质量要求的假设检测数据,这将导致扩张。信息的模糊性源于由于已建立的测试不完善而导致的数据缺失问题:未观察到真实感染和测试结果的联合分布。利用Copula理论的结果,我构造了所有这些可能的联合分布的集合(通常是非单态的),这允许我评估新测试的信息性。该分析得出了一个简单的充分条件,以确保新测试不是一个膨胀。我用三个2019冠状病毒疾病相关测试的数据来说明我的方法。两种快速抗原检测很容易满足我的充分条件,因此信息丰富。然而,不太准确的程序,如胸部CT扫描,可能会出现扩张。
---
分类信息:

一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--

---
PDF下载:
--> Binary_Classification_Tests,_Imperfect_Standards,_and_Ambiguous_Information.pdf (384.09 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:模棱两可 econometrics distribution Applications Econometric

沙发
能者818 在职认证  发表于 2022-4-26 15:10:47
二元分类测试、不完善的标准和不明确的信息*Gabriel Ziegler+2021年1月21日摘要新的二元分类测试通常相对于预先确定的测试进行评估。例如,用于检测SARS-CoV-2的快速抗原试验相对于更成熟的PCR试验进行评估。在本文中,我认为新的测试可以被描述为在预先建立的测试不完善时产生模糊信息。这就产生了一种称为膨胀的现象——一种非信息性的极端形式。作为一个例子,我给出了满足WHO对快速抗原检测的最低质量要求的假设检测数据,因为ich会导致扩张。由于现有检测的不完善,信息中的歧义源于数据缺失问题:未观察到真实感染和检测结果的联合分布。利用Copula理论的结果,我构建了所有这些可能的联合分布的集合(通常是非单态的),这使我能够评估新测试的信息性。这种分析导致了一个简单有效的条件,以确保一个新的测试不是一个膨胀。我用三项新冠肺炎相关测试的数据来说明我的方法。两种快速抗原检测很容易满足我的要求,因此信息丰富。然而,不太准确的程序,如胸部CT扫描,可能会出现扩张。关键词:二元检验、歧义、信息、扩张、SARS-CoV-2、2019冠状病毒疾病*感谢Dan Sacks、Charles Manski和J¨org Stoye的文学指点。我感谢菲利波布拉多维奇的宝贵评论。克里斯托弗·斯塔彭赫斯特提供了出色的研究协助。

藤椅
nandehutu2022 在职认证  发表于 2022-4-26 15:10:54
所有的错误都是我的。+爱丁堡大学经济学院;英国爱丁堡Buccleuch Place 31号,EH89JT;ziegler@ed.ac.uk.1引言评估新诊断测试的一个重要方面是评估其准确性。直觉上,一个合理的二元测试应该有与潜在健康状况高度相关的测试结果。在其他情况下,检测结果可能呈阳性,只有被检测者确实感染或患病。然而,确定一个人是否真的被感染往往代价高昂,甚至是不可能的。因此,相对于已建立的测试,分析新的测试。当且仅当患者确实被感染时,当检测结果呈阳性时,已建立的检测才是完美的。医学文献将这些完美的测试称为“黄金标准”(Watson等人,2020年)。在这些情况下,新测试结果和潜在真实健康状况的联合分布与两项测试结果的联合分布相同。因此,这种观察到的联合分布可以用来评估新测试的准确性。然而,在实践中,并不存在完美的参考测试。在这种情况下,研究人员需要两种测试的健康状况和结果的联合分布。这种整体联合分布是不可观察的(或者只有在研究人员获取数据的成本很高的情况下才可能)。这种缺失数据的问题导致了两个截然不同的问题:(i)基本健康状况的边际分布缺失;(ii)新测试的soutcome与健康状况之间的相关性缺失。这些问题中的后一个会导致新测试提供的信息模棱两可。这些问题中的第一个是关于潜在健康状况的缺失数据,这是众所周知的。

板凳
kedemingshi 在职认证  发表于 2022-4-26 15:11:00
最近,Manski和Molinari(2021年)使用部分识别文献中已知的方法,提供了人群中感染者的患病率范围。测量患病率不同于通常的推断问题,因为受试人群可能无法代表整个人群。这里有选择性地观察数据,这与Manski(1989)提出的选择问题相对应。此外,Manski(2020)阐述了在2019冠状病毒疾病抗体检测的背景下,如何在保持完美参考检测假设的情况下,将此问题延伸至评估新检测的准确性。在下文中,我不会区分感染和生病。根据问题的不同,可能需要考虑新测试源代码的联合分布和潜在的真实健康状况。例如,分析小节2.2只要求这种二元联合分布。如第2.3节所述,需要三变量分布来评估进行这两项测试的信息量。在导言中,我使用了“相关性”这个词,这是一个松散而非正式的词。Toye(2020年)和Sacks等人(2020年)也使用了类似的方法。2导言第二个关于相关性的缺失数据的问题在性质上是不同的,当有一个完美的参考时可以避免。即使人们假设对患病率的了解,潜在的多个“相关结构”也与观察到的数据一致。这种多重性的原因在概率论研究的copulas中是众所周知的。患病率知识提供了健康状况的边际分布,而观察到的测试数据提供了(无变量)边际分布。一般来说,这些边际分布存在多个(三变量)联合分布。

报纸
能者818 在职认证  发表于 2022-4-26 15:11:06
由于这种多样性,不可能对新测试进行简单、明确的解释。在不了解患病率的情况下,之前发现的问题会继续存在,因此会加剧总体多样性。然而,正如后面更详细地讨论的那样,含糊不清的信息只来源于缺少的相关数据,因此无论研究人员是否了解患病率,都会发生。在本文中,我提供了一个理论框架,将Manski和Molinari(2021年)和Stoye(2020年)关于选择性测试的见解与由于不完善的参考测试而产生的缺失相关数据结合起来。在这个框架内,可以解决两种测试的信息性问题。首先,命题1表明,已建立的测试的阴性预测值通常不是由一个数字给出的,但它总是有用的。这种多样性的出现仅仅是因为问题(i)。然后,我只对测试人群分析了新测试的信息量。对受试人群的关注简化了代数,并进一步消除了关于患病率的模糊性(参见问题(i)),因此,我可以研究新分离测试(仅问题(ii))中模糊信息的本质。最后,我研究了如果存在影响,对信息性的影响。研究考试的信息性在概率论、统计学、经济学和哲学中有着悠久的传统。Blackwell(1951、1953)为(现在称为Blackwell)实验引入了“更多信息”的概念。经验检验是从世界各国到信号分布的映射。在当前设置中,实验是一个函数,它将分布的检测结果与每个可能的健康状况相关联,即感染和健康状况。

地板
能者818 在职认证  发表于 2022-4-26 15:11:12
在这种情况下,信息的价值取决于贝叶斯决策者愿意为实验支付多少费用。因为everyA测试的阴性预测值是在获得阴性测试结果的条件下健康的概率。另一个重要的信息量指标是阳性预测值,即在阳性检测结果的条件下被感染的概率。我将自始至终假设,所建立的模型具有与SARS-CoV-2检测一致的完美预测值。de Oliveira(2018)提供了一种更有效的治疗方法。Blackwell的理论表明,对于每一个Bayesian决策者来说,实验比没有信息的实验更能提供信息。理想情况下,诊断测试应满足Blackwell对实验的定义,以确保其始终具有信息性。然而,这通常只适用于我的框架中已建立的测试。新的测试未能成为Blackwell实验,因为它没有将每个状态映射到测试结果的唯一分布。相反,由于联合分布的多样性,在特定健康条件下,测试结果上存在一组分布。因此,Blackwell的信息性概念不适用于新测试。此外,信息的价值需要调整,因为aBayesian分析不容易应用于概率集。

7
能者818 在职认证  发表于 2022-4-26 15:11:19
这种情况通常被称为“模糊”情况,文献已经确定了贝叶斯决策在模糊领域的若干扩展。在某种情况下,我没有为特定的决策标准定义信息的价值,而是采用了一个非常弱的信息性概念:诊断性睾丸信息性当且仅当它不是扩张时。Seidenfeld和Wasserman(1993)在概率集合的情况下引入了膨胀的表示法。在当前上下文中,如果无论得到什么测试结果,以该信息为条件的一组概率包含原始概率集,就会发生膨胀。图1展示了一个膨胀的例子。这里,表示检测前感染可能性的概率集(bla ck集合)位于检测结果后的两个集合内(蓝色表示阳性结果,红色表示阴性结果后的集合)。因此,从某种意义上说,无论测试结果如何,决策者在测试后的表现都比测试前差。因此,Seidenfeld和Wasserman将扩张称为“违反直觉的现象”,Gul a和Pesendorfer(2018)将其称为“所有新闻都是坏消息”。我的框架允许充分描述何时需要进行新的诊断测试(参见表达式(3))。由于对测试信息性的定义较弱,任何合理的测试都应满足这一标准。

8
mingdashike22 在职认证  发表于 2022-4-26 15:11:25
表征提供了一种方法来验证新测试是否具有信息性。如果上面提到的映射是一个常数函数,那么实验是没有信息的?Blackwell更强调他的“信息量更大”的概念,要求每个贝叶斯决策者在信息量更大的实验中都有更高的信息价值。从形式上讲,新的测试可以看作是一个对应的或设定值的d函数。Machina和Sinisc alchi(2014)提供了关于该主题的最新概述。4简介试验前P(已感染)试验后P(已感染)阳性试验结果阴性试验结果图1:诊断试验如表1:扩张试验Da t az\\y y=0 y=1 Sumz=0 39.5%11.5%51%z=1 1 1.2%47.8%49%Sum 40.7%59.3%y=1表示阳性PCR试验结果(即已建立的试验)。z=1表示抗原检测呈阳性。WHO(2020年)建议对rapidAntigen试验的最低准确度标准。通常情况下,PCR测试是用于评估t-heseAntigen测试的既定测试(Esbin等人,2020年)。表1说明了假设的测试数据,满足世卫组织的最低要求。然而,正如分析将揭示的那样,这项测试实际上是一种扩张,因此没有提供信息。对于最低要求的精度标准,膨胀特性提供了一个易于验证的有效条件,以避免膨胀。这项新测试(在受尊敬的人群中)对新测试呈阳性的人群进行了介绍≤新试验的最小灵敏度×已建立试验的灵敏度。对于消息灵通的读者,世卫组织建议敏感性至少为80%,特异性至少为97%。这些措施将在稍后正式引入和定义。该声明取决于已建立的PCR检测的准确性。

9
何人来此 在职认证  发表于 2022-4-26 15:11:31
只有当PCR在文献未提及的较低范围内具有敏感性时,才会发生扩张。除了膨胀的理论应用,文献中还没有太多的经验证据。最近,经济学家开始通过实验研究膨胀和模糊信息。Shishkin和Ortoleva(2020)进行了唯一一项实验,重点研究决策者对膨胀的反应,以及如何将行为与信息的价值联系起来。据我所知,诊断试验(或更具体的SARS-CoV-2试验)可能出现的扩张是“在现场”首次观察到的这种现象当然,研究诊断测试的研究人员很清楚这里讨论的一般问题。导致未观察到的患病率的选择问题被称为验证偏差,而由不完善的参考测试导致的未观察到的相关性所引起的问题被描述为不完善的金标准偏差。(Zhou等人,2014年,第10-11章)本文不是第一次记录这些问题中的任何一个导致未识别模型;而本文的新颖之处在于方法。诊断测试研究试图通过引入额外假设来避免未识别的模型,然后解决相对于基线假设产生的偏差。建议的方法包括简单地插补缺失数据或考虑更复杂的校正方法。此外,这两个问题往往是分开解决的。相比之下,我的框架需要最少的假设,同时解决这两个问题。2主要分析我考虑以下情况。x=1表示一个人被感染,x=0表示该人健康。最初,有二元测试可用,其中y=1表示阳性测试结果,y=0表示阴性结果。

10
何人来此 在职认证  发表于 2022-4-26 15:11:37
最后,介绍了一种新的检测方法,它可以是阳性(z=1)或阴性(z=0)。设P(x,y,z)表示考虑中的人口分布,P:=P(x=1)表示患病率。然而,人口分布是无法直接观察到的。当然,几乎总是这样,因为研究人员通常只观察人口分布中的样本。这就导致了通常的引用问题。自始至终,我将完全从推理中抽象出来。取而代之的是,这些数据是为那些在newManski(2018年)报告中提到扩张可能在不同的医学背景下发生的人提供的,但没有进一步解决这个问题。Reitsma等人(2009年)为应用研究人员提供了一个流程图,以帮助他们解决在确定诊断测试准确性时出现的几个问题。这两个问题分别存在于流程图的两个不同分支中。6.主要分析测试。因此,表示t=1和t=0的受试者,否则。然后,数据由P(y,z | t=1)给出,我假设P(t=1)>0.15,16此外,由于已建立的测试是众所周知的,关于该测试的灵敏度和特异性的精确信息也可用。以下假设确保了这两个指标都得到了很好的定义。假设1(非平凡患病率)。人口满意度∈ (0, 1).根据该假设,初始测试的敏感性和特异性分别定义为:P(y=1 | x=1)=P(x=1,y=1)P=:σ,(1)P(y=0 | x=0)=P(x=0,y=0)1- p、 (2)正如inManski(2020)所讨论的,f对于决策敏感性和特殊性不是相关措施。相关指标为阳性预测值(PPV)和阴性预测值(NPV)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 18:46