楼主: kedemingshi
1164 33

[经济学] 令人反感的比较:作为复合决策的排名和选择 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.2735
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-4-26 16:11:19 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Invidious Comparisons: Ranking and Selection as Compound Decisions》
---
作者:
Jiaying Gu and Roger Koenker
---
最新提交年份:
2021
---
英文摘要:
  There is an innate human tendency, one might call it the \"league table mentality,\" to construct rankings. Schools, hospitals, sports teams, movies, and myriad other objects are ranked even though their inherent multi-dimensionality would suggest that -- at best -- only partial orderings were possible. We consider a large class of elementary ranking problems in which we observe noisy, scalar measurements of merit for $n$ objects of potentially heterogeneous precision and are asked to select a group of the objects that are \"most meritorious.\" The problem is naturally formulated in the compound decision framework of Robbins\'s (1956) empirical Bayes theory, but it also exhibits close connections to the recent literature on multiple testing. The nonparametric maximum likelihood estimator for mixture models (Kiefer and Wolfowitz (1956)) is employed to construct optimal ranking and selection rules. Performance of the rules is evaluated in simulations and an application to ranking U.S kidney dialysis centers.
---
中文摘要:
人类有一种天生的倾向,可以称之为“排行榜心态”,即构建排名。学校、医院、运动队、电影和无数其他物体都会被排序,尽管它们固有的多维性表明——充其量——只有部分排序是可能的。我们考虑了一大类基本排序问题,在这些问题中,我们观察到噪音、标量的价值测量值,这些测量值为$n$具有潜在异质精度的对象,并被要求选择一组“最有价值”的对象这个问题自然是在罗宾斯(1956)的经验贝叶斯理论的复合决策框架中形成的,但它也与最近关于多重测试的文献密切相关。利用混合模型的非参数极大似然估计(Kiefer and Wolfowitz(1956))构造最优排序和选择规则。这些规则的性能在模拟中进行了评估,并应用于美国肾透析中心的排名。
---
分类信息:

一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--
一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--

---
PDF下载:
--> Invidious_Comparisons:_Ranking_and_Selection_as_Compound_Decisions.pdf (1.32 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:econometrics Multivariate Measurements Econometric Application

沙发
何人来此 在职认证  发表于 2022-4-26 16:11:27
令人反感的比较:作为复合决策的排名和选择顾家英和罗杰·科恩克尔摘要。人们有一种天生的倾向,可以称之为“联盟心态”,即构建排名。学校、医院、运动队、电影和无数其他物品都会被排名,尽管它们固有的多维性最多只能说明部分排序是可能的。我们考虑了一大类的基本排序问题,在这些问题中,我们观察了n个具有潜在异质精度的对象的噪声、规模度量,并被要求选择一组“最优秀”的对象这个问题是在罗宾斯(1956)的经验贝叶斯理论的复合决策框架中自然形成的,但它也与最近关于多重测试的文献密切相关。利用混合模型的非参数极大似然估计(Kiefer and Wolfowitz(1956))构造最优排序和选择规则。这些规则的性能将在模拟中进行评估,并应用于排名靠前的美国肾透析中心。1.导言在沃尔德关于统计决策理论的开创性专著发表后,人们越来越意识到,内曼-皮尔逊测试仪器不足以胜任许多重要的统计任务。排名和选择问题在这种看法中占突出地位。出于哈罗德·霍特林的建议,巴哈杜尔(1950)研究了几种高斯种群中最佳种群的选择。假设K个群体的样本均值都是均值θ和方差,那么选择最佳群体θ的问题*= maxi{θ,…,θK}表示为选择权z,···,zk最小化,L(θ,z)=θ*-KXk=1zkθk/KXk=1zk。Bahadur指出,在“公正的决策规则”中。

藤椅
能者818 在职认证  发表于 2022-4-26 16:11:33
置换等变中心,只选择样本均值最大的群体,即选择z,是一致最优的*如果\'Xi=max{X,···,\'XK}和z,i=1*否则,i=0,从而清楚地表明,进行平均数均等初步测试,然后在测试未能拒绝时,为几个甚至所有人群选择zi>0的程序是不可接受的。Bahadur和Robbins(1950)加强了这一发现,他们专注于两个样本设置,但放宽了共同方差版本:2021 9月16日。这篇论文作为沃尔拉斯·鲍利在2020年世界计量经济学会大会上的演讲发表,并致力于纪念拉里·布朗,他向我们介绍了经验贝叶斯方法。我们感谢迈克尔·吉拉因、平野敬介、罗伯特麦克米兰、斯坦尼斯拉夫·沃尔古舍夫和赵思海的有益讨论。顾家英感谢加拿大社会科学和人文研究委员会的财政支持。2.令人反感的比较假设。在相关研究中,贝切霍夫(1954年)和古普塔(1956年)试图优化选定种群的数量及其身份,参见古普塔和潘查皮克桑(1979年)和贝切霍夫、基弗和索贝尔(1968年)对后续发展的广泛回顾。Goel和Rubin(1977)开创了分层贝叶斯选择方法,在随后的几十年中,许多作者采用了这种方法,早在Bergerand Deely(1988)和Laird and Louis(1989)就采用了这种方法。Portnoy(1982)表明,在高斯多元方差分量模型中,基于最佳线性预测的Rankingsb是最优的,但警告说,偏离正态性很容易破坏这种最优性。

板凳
可人4 在职认证  发表于 2022-4-26 16:11:39
层次模型范式的一个显著特征是认识到样本观测可能表现出不同的精度;这通常通过假设观察样本均值的已知方差来解释。随着分级和选择方法在基因组应用中变得越来越重要,人们对损失函数以及与新兴的多重测试文献的联系重新产生了兴趣。混合模型的非参数估计及其对各种复合决策问题的相关性的最新发展为我们的观点提供了依据。这种方法旨在减少对早期文献中普遍存在的高斯分布假设的依赖。正如我们在其他地方指出的那样,Gu和Koenker(2016a)以及Koenker和Gu(2019)的非参数经验贝叶斯方法为多个测试和复合决策问题的更传统的参数层次贝叶斯提供了强大的补充方法。我们在这篇文章中的主要目标是详细阐述这个断言,用于排名和选择应用程序。在整个过程中,我们试图与有关多重测试的文献进行对比。我们将把注意力限制在观察未观察到的潜在质量测量的尺度估计及其精度的一些测量的设置上,从而避免更复杂的多变量设置,如Boyd、Cortes、Mohri和Radovanovic(2012)采用分位数回归方法。Chetty及其合作者在美国的教学评估和地理流动性方面开展了大量工作,这激发了Mogstad、Romano、Shaikh、,Wilhelm(2020)提出了新的重新抽样方法,用于构建有限人口排名和选择的信任集。

报纸
何人来此 在职认证  发表于 2022-4-26 16:11:45
Armstrong、Koles\'ar和Plagborg-Moller(2020)提出了一种创新方法,用于为Chetty使用的经典、线性收缩、经验Bayes估计量构建置信区间。Andrews、Kitagawa和McCloskey(2020年)以及Guo和He(2020年)最近的工作提出了针对高排名个体或治疗的新的置信区间结构,这些都受到最近对“模型选择后的推理”文献的贡献的影响。与这些推理方法相反,我们将重点放在复合决策的互补视角上,构建决策规则,以选择最佳或最差的群体,并控制所选元素的预期数量以及所选元素中错误发现的预期比例。复合决策框架不是孤立地处理每个选择决策,而是试图利用它们的共同结构来提高集体绩效。因此,我们的方法与Kline和Walters(2021年)的方法更为一致,他们研究了Gu和Koenker 3决策规则,用二项混合模型中密切相关的GMM方法从涉及实际工作申请的实验中评估雇主歧视。Gillaine、Gu和McMillan(2020)研究了教师增值估计,采用非参数最大似然方法估计高斯混合模型,我们在下文中倡导了这一点。他们对来自北卡罗来纳州和洛杉矶的数据进行的分析表明,对于潜在增加值,更灵活的混合模型具有优势。

地板
能者818 在职认证  发表于 2022-4-26 16:11:52
与目前的工作不同,他们关注后验贝叶斯规则,后验贝叶斯规则通常用于研究教师对学生未来结果的影响。这些更灵活的非参数经验贝叶斯方法改进了传统的线性收缩规则,尤其是在政策关注通常集中的分布尾部。这是对目前工作的排名和选择目标的一个有价值的补充视角。在继续之前,重要的是要承认,尽管它具有普遍的外观和应用,但正如我们的标题所暗示的,许多排名和选择问题本身是徒劳的。如果真实质量的潜在度量是高斯的,就像在选择问题的几乎所有计量经济学应用中所假设的那样,并且鉴于真实质量受高斯噪声的影响,我们希望选择前10%的个体,那么当信噪比较低时,准确的选择可能非常困难。我们将看到,经典James Stein公式中体现的传统线性收缩比最大似然(固定效应)程序能显著提高性能,通过仔细调整尾部概率损失的决策规则,可以进一步提高性能。然而,我们发现,当测量误差的大小与潜在能力的高斯变异性相当时,即使是包含问题精确分布特征的完整知识的oracle决策规则,也可能无法实现比所选个体的潜在能力高于选择阈值的几率更高的结果。

7
mingdashike22 在职认证  发表于 2022-4-26 16:11:59
当能力的潜在分布是重尾分布时,选择变得更容易,更明确的选择规则更有利,但正如我们将展示的那样,选择问题仍然相当具有挑战性。因此,本文的第二个目的是为那些已经对现有排名和选择方法的可靠性提出质疑的人增加另一个警告。Goldstein和Spiegelhalter(1996)对排名和选择在公共政策应用中的作用进行了批判性概述。人们普遍认为,目前使用的排行榜可能会对政策产生有害影响,这一观点在Gelman和Price(1999)中得到了强调。虽然这些批评大多归因于数据收集不足和固有的低信噪比,但我们相信,在方法上也有改进的余地。第2节简要概述了复合决策理论,并描述了估计高斯混合模型的非参数方法。第3节介绍了我们在观测测量精度均匀的环境中进行排序和选择的基本框架。在第4节中,我们介绍了已知形式的异质精度,第5节考虑了观测值的联合分布及其精度决定排名和选择规则形式的设置。在假设未观察到的潜在观测质量的混合形式和分布是已知的情况下,在这些部分中的每一部分都推导出了最佳排序和选择规则。第6节介绍了可行的排序和选择规则,以及它们达到与最优规则相同的渐近性能的条件。

8
能者818 在职认证  发表于 2022-4-26 16:12:05
第7节接着比较了几种可行的排序和选择方法,有些忽略了问题的复合决策结构,有些采用参数经验贝叶斯方法,有些则依赖于非参数经验贝叶斯方法。最后,第8节描述了在美国评估医用透析器性能的实证应用。附录A.2收集了所有正式结果的证明。复合决策框架Robbins(1951)对Wald(1950)新兴的极大极小决策理论提出了挑战:假设我们观察到独立的高斯实现,Yi~ N(θi,1),i=1,··,N表示θi等于+1或-1.我们被要求估计n向量θ=(θ,···,θn)的平均绝对误差损失,L(^θ,θ)=n-1nXi=1 |^θi- θi |。当n=1时,Robbins证明极小极大决策规则为δ(y)=sgn(y);在问题的最不利变量中,恶毒的本性选择了概率相等的±1,最佳响应是当Yi为正时估计θi=+1,θi=-1否则。Robbins进一步证明,当n>1时,这个规则仍然是minimax,每个坐标都被独立处理,就像完全孤立地查看一样。这也是最大似然估计量,在计量经济学术语中可以被视为经典的固定效应估计量。但这一切合理吗?我们的样本是否传达了±1的相对频率信息,这可能与极大极小规则的悲观假设相矛盾?如果我们碰巧知道无条件概率p=p(θi=1),那么θ=1给定Yi=y的条件概率由p(θ=1 | y)=p k(y)给出- 1) p k(y)- 1) + (1 - p) ν(y+1),其中,Ф表示标准高斯密度。

9
kedemingshi 在职认证  发表于 2022-4-26 16:12:11
如果这个概率超过1/2,我们应该猜测^θi=1,给出了修正的决策规则δp(y)=sgn(y)-日志((1)- p) /p))。在计算信号之前,通过简单的逻辑扰动对每个观测值yi进行修改。我们观察到的随机样本y=(y,··,yn)是关于p的信息。我们有对数似然,`n(p | y)=nXi=1log(p|(yi- 1) + (1 - p) ν(yi+1)),如果需要,可以通过某种形式的先验来增加,以获得p的后验概率和用于估计每个θi的插件贝叶斯规则。当p6=1/2时,该过程的贝叶斯风险大大小于极大极小风险,当p=1/2时,贝叶斯风险渐近等价于极大极小风险。这就是复合决策理论的Firstgu和Koenker 5原则:在一整套相关决策问题中借用优势,可以提高集体绩效。当我们放松对θ的支撑的限制,并允许对整个实线的支撑时,会发生什么?我们现在有了一个通用的高斯混合设置,其中观察到的Yi具有卷积给出的边缘密度,f=ν* G、 也就是说,f(y)=Zа(y)- θ) dG(θ),而不是仅仅需要估计一个概率,我们需要一个完整分布函数的估计,G.Kiefer和Wolfowitz(1956),由Robbins(1950)的Abstract预测,建立了非参数最大似然估计(NPMLE),^G=argminG∈G{-nXi=1log f(yi)|f(yi)=Z- θ) dG(θ)}其中G是R上概率测度的空间,是G的一致估计量。这是一个有限维凸优化问题,具有严格的凸目标,受线性约束。关于NPMLE问题的几何和计算方面的更多细节,请参见Lindsay(1995)和Koenker and Mizera(2014)。

10
nandehutu2022 在职认证  发表于 2022-4-26 16:12:19
Heckman和Singer(1984年)在计量经济学中率先提出了这种方法,认为需要更灵活的异质性模型来可靠估计生存模型中的持续时间依赖性。G必须是非减量的这一看似无害的条件的一个强有力的结果是,^G必须是原子的,这是一个不含n个原子的离散分布。第二个结果是,NPMLE是“自正则化”的,即原子的数量、位置和质量都由优化共同确定,而无需任何辅助调谐参数。这都是经典Carath’eodory定理的结果,但直到最近,人们对表征溶液的原子数的精确增长率知之甚少,尽管经验表明它相当缓慢。Polyanskiy和Wu(2020)最近已经确定,对于具有次高斯尾的G,其支撑的基数,即^G的原子数,像O(对数n)一样增长。因此,在没有任何进一步处罚的情况下,最大似然法自动选择了一个高度精简的^G。这与有限维混合模型的最大似然法或采用傅里叶方法的高斯反卷积法的臭名昭著的困难形成了鲜明对比。看到NPMLE^G的复杂度上界仅为Yo(logn),人们可能会怀疑O(logn)混合物是否“足够复杂”,足以充分代表生成我们观察数据的过程。Polyanskiy和Wu(2020)也提出了这个问题:他们指出,对于任何次高斯G,都存在一个离散分布Gk,其中k=O(对数n)原子,因此对于fk=ν*Gk,总变异距离,tv(f,fk)=o(1/n),因此,考虑G的估计量,其复杂性的增长速度比o(logn)更快,这在统计学上是合理的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 18:15