楼主: kedemingshi
1164 33

[经济学] 令人反感的比较:作为复合决策的排名和选择 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-4-26 16:13:31
异质已知方差上一节中的同质方差假设在大多数应用中是不可持续的。击球平均数伴随着一些“at bats”,平均测试分数表现伴随着学生样本量。在本节中,我们将考虑扩展模型Yi~ N(θi,σi)和θi~ G、 σi~ H、 σi⊥⊥ θiWe将假设我们观察到σi,这一假设将在下一节中放松。4.1. 后尾概率。与HA:θ的假设相同≥θα,再次考虑后尾概率是很自然的,现在作为对的函数,(yi,σi),vα(yi,σi)=P(θi)≥ θα| yi,σi)=R+∞θα|(yi |θ,σi)dG(θ)R+∞-∞ν(yi |θ,σi)dG(θ)。用(3.1)中规定的损失函数解决相同的决策问题,我们有条件风险,Eθ| Y,σhL(δ,θ)i=nXi=1(1-δi)vα(Yi,σi)+τnXi=1{δi(1-vα(Yi,σi))-γδi}+τnXi=1δi-αn.Gu和Koenker 13对(Yi,σi)的联合分布进行了另一个期望,即贝叶斯规则解算nδEhnXi=1(1)-δi)vα(yi,σi)i+τEhnXi=1n(1-vα(yi,σi))δi-γδioi+τEhnXi=1δii-αn最优选择规则可以再次描述为阈值规则onvα(yi,σi)。提议4.1。对于预先指定的对(α,γ),γ<1-α、 贝叶斯规则的形式是δ*(y,σ)=1{vα(y,σ)≥ λ*(α,γ)}式中λ*(α,γ)=max{λ*(α, γ), λ*(α)},λ*(α,γ)=minnλ:RRθα-∞■Φ((tα(λ,σ)- θ) /σ)dG(θ)dH(σ)RR+∞-∞■Φ((tα(λ,σ)- θ) /σ)dG(θ)dH(σ)- γ ≤ 0oλ*(α) =minnλ:Z+∞-∞■Φ((tα(λ,σ)- θ) /σ)dG(θ)dH(σ)- α ≤ 0o和tα(λ,σ)定义为vα(tα(λ,σ),σ)=所有λ的λ∈ [0, 1].评论注意,虽然阈值λ*不取决于σ的值,排名取决于σ。一种方法是,由于vα(y,σ)在y中对所有σ>0都是单调的,所以最优规则等价于1{yi>tα(λ)*, σ) },其中tα(λ,σ)是σ的函数。

22
nandehutu2022 在职认证  发表于 2022-4-26 16:13:37
对于λ的固定值*, YDE的选择区域以非线性方式依赖于σ。比较个体i和j,可能是yi>yj,但yj延伸到选择区域,而yi没有。下面是一个例子。还应强调的是,当方差不均匀时,不同的损失函数不必导致等价的选择。4.2. 传统的无效假设。后验尾概率准则的动机是将排序和选择问题视为假设检验,同时允许零假设是α依赖的。结果证明,完整假设的特殊构造对排名工作至关重要。在这一小节中,我们给出了一个简单的例子来说明基于零影响的传统零假设的尾部概率并不会产生强大的排名工具。考虑由三组分正态混合模型生成的数据,(4.1)Yi |σi~ 0.85N(-1,σi)+0.1N(0.5,σi)+0.05N(5,σi),σi~ U[0.5,4]我们考虑T(yi,σi)=P(θi>0 | yi,σi)=R,而不是用vα变换数据+∞ν(yi |θ,σi)dG(θ)R+∞-∞ν(yi |θ,σi)dG(θ),并相应地对个体进行排序。这种转换对应于Sun和McLain(2012)中提出的程序,并在传统的零假设H:θ下用于多个测试问题≤ 0.判定规则δTi=1{T(yi,σi)≥ λ} 然后选择考虑电容约束和FDR控制约束的切割值λ,以选择顶部α比例。图4.1比较了α=5%和边际FDR控制水平为10%的两种排名程序的选择区域。黑色实线对应14个令人讨厌的对比。5 1.0 1.5 2.0 2.5 3.0 3.5 4.00 5 10 15σ阈值零零零零尾零图4.1。基于模型(4.1)的选择边界,α=0.05,γ=0.1。

23
何人来此 在职认证  发表于 2022-4-26 16:13:44
实心黑色曲线对应于基于变换vα的选择区域的边界。红色虚线对应于基于变换T的选择区域的边界。假设σ的密度在区间[0.5,4]上是均匀的。使用基于变换vα的排序的选择边界,红色虚线对应于使用基于变换T的排序的选择边界。黑色选择边界下方的黑色突出显示区域对应于一个区域,其中基于T的排序方法将进行选择,但基于vα的排序方法不进行选择。另一方面,蓝色突出显示的区域对应于vα选择的区域,但不是T。变换T将黑色区域中的区域排列为高于蓝色区域中的区域,因为尽管它们的影响相对较小,它们的相关方差也较小,这表明这些个体比那些位于蓝色区域的个体有更有力的证据表明其θ为正。然而,我们的任务是在上尾找到具有真正影响θi的个体。对于α=5%,我们的目标是选择θ=5的所有个体,黑色区域的个体提供了强有力的证据,表明他们的真实影响不能太大,因为他们的观察效果很小,相关方差也很小,而蓝色区域的个体,尽管观察到的平均效应与较大的方差相关,但有合理的证据表明它们相关的真实效应θ可能很大。这一证据在变换T中不明显,但在变换vα中被捕捉到。事实上,基于两种不同转换vα和T的平均排名能力显著不同。将选择规则的幂定义为β(δ):=P(θi≥θα,δi=1)/P(θi≥ θα),根据决策规则δ,然后β(δT)=39%和β(δ*) = 69%.

24
何人来此 在职认证  发表于 2022-4-26 16:13:50
因此,尽管许多文献依赖于基于某种形式的后验平均数和传统假设检验工具的排序和选择规则,但我们要提醒的是,这种方法可能会产生误导,而且效率低下。顾和科恩克154.3。选择集的嵌套性。如果我们放宽容量限制,允许选择更大的比例,α>α,同时保持我们最初的错误发现控制,我们希望在更严格的容量限制下选择的成员应在放宽的限制下保持选中状态。我们现在讨论在使用后验尾概率规则时获得选择集嵌套性的充分条件。在我们分析透析中心的排名和选择时,这是一个自然条件,特别是因为我们想给中心的几个亚组分配“字母等级”。最优贝叶斯规则将每对(α,γ)的选择集定义为Ohmα、 γ:={(y,σ):vα(y,σ)≥ λ*(α,γ)}当σ已知时,vα(y,σ)在y中是单调的,如引理3.2所示,对于每个固定的σ,选择集也可以表示为Ohmα、 γ={(y,σ):y≥ tα(λ)*(α,γ),σ)}也便于以后的讨论来定义OhmF DRα,γ:={(y,σ):vα(y,σ)≥ λ*(α,γ)}={(y,σ):y≥ tα(λ)*(α, γ), σ)}OhmCα:={(y,σ):vα(y,σ)≥ λ*(α) }={(y,σ):y≥ tα(λ)*(α) ,σ)}分别是错误发现率约束或容量约束绑定时的选择集。很容易看出这一点Ohmα,γ= OhmF DRα,γ∩ OhmCα。引理4.2。设vα(yi,σi)的密度函数表示为fv(v;α),并设λ*(α,γ)=minnλ:RRθα-∞■Φ((tα(λ,σ)- θ) /σ)dG(θ)dH(σ)RR+∞-∞■Φ((tα(λ,σ)- θ) /σ)dG(θ)dH(σ)- γ ≤ tα(λ,σ)定义为vα(tα(λ,σ),σ)=λ和∧Φ是标准正态随机变量的生存函数。

25
何人来此 在职认证  发表于 2022-4-26 16:13:56
如果αlogfv(v;α)在v中不递减,那么对于固定的γ,如果α>α,我们有λ*(α, γ) ≤ λ*(α, γ).评论密度函数fv(v;α)可以看作是由参数α索引的v的函数。fv(v;α)的显式形式见第4.4节(正常模型)。引理4.2中的条件等价于单调线性条件,即当α>α时,似然比fv(v;α)/fv(v;α)在v中是不减的。推论4.3。如果引理4.2中的条件成立,那么OhmF DRα,γ OhmF DRα,γ表示任何α>α。评论引理4.2中的条件是充分的,但不是嵌套的必要条件OhmF DRα,γ。即使λ*(α, γ) > λ*(α,γ),我们仍然可以有tα(λ)*(α,γ),σ)<tα(λ)*(α,γ),σ),因为函数vα(Y,σ)依赖于α,其逆函数tα也依赖于α。引理4.4。让λ*(α) 定义见提案4.1。如果对于任何α>α,tα(λ*(α), σ) ≤ tα(λ)*(α) ,σ)对于每个σOhmCα OhmCα.16令人反感的对比标记。这里的单调性与亨德森和牛顿(2016)定理3中的条件一致,后者证明了当G为高斯时,它成立。然而,它不必如我们在C.引理4.5节中的反例所示保持不变。如果αlogfv(v;α)在v和引理4中都是不递减的。4保持不变,则对于固定的γ,选择区域具有嵌套结构:如果α>α,则Ohmα,γ Ohmα,γ.4.4. 例子。在本节中,我们考虑几个例子,从最简单的经典情况开始,其中θi代表标准高斯分布的随机样本。关于混合分布G形式的高斯假设几乎是应用经济学中所有经验贝叶斯文献的基础;这正是通常采用的线性收缩规则的正确之处。实例[Gaussian G]考虑正态模型,其中y |θ,σ~ N(θ,σ)和θ~ N(0,σθ)和σ~ 具有密度函数H(σ)。

26
何人来此 在职认证  发表于 2022-4-26 16:14:02
给定σ的y的边际分布为N(0,σ+σθ),且(y,σ)的联合密度的形式为,f(y,σ)=p2π(σ+σθ)expn-y2(σ+σθ)oh(σ)。给定正态共轭,θ| y,σ的后验分布遵循N(ρy,ρσ),其中ρ=σθ/(σθ+σ)。因此,随机变量v是一对(Y,σ)的变换,定义为,v=ψ(Y,σ):=P(θ)≥ θα| y,σ)=Φ((ρy)- θα)/pρσ)。对于固定σ,ψ在y和ψ中单调递增-1(v)=θα/ρ+pσ/ρΦ-1(v)与vψ-1(v)=pσ/ρ/а(Φ-1(v))。因此,v和σ的联合密度为g(v,σ)=f(ψ)-1(v),σ)|vψ-1(v)|=p2π(σ+σθ)expn-(θα/ρ+pσ/ρΦ)-1(v))2(σ+σθ)opσ/ρφ(Φ-1(v))h(σ)。积分出σ,我们得到了v的边缘密度,fv(v;α)=Zp2π(σ+σθ)expn-(θα/ρ+pσ/ρΦ)-1(v))2(σ+σθ)opσ/ρφ(Φ-容量约束为P(v)≥ λ*) = α、 带截止值λ*, 满足,α=P(v)≥ λ*) = 1.-ZΦθαpσ+σθσθ- Φ-1(1 - λ*)qσ/σθdH(σ)。找到λ*, 我们可以使用命题4.1中提供的公式。更直接的方法是认识到,见第6节,FDR控制约束定义为γ=E[(1- v) 1{v≥ λ*}]/P(v)≥ λ*), 其中,截止值λ*定义为γ=Zλ*(1 - v) fv(v;α)dv/Zλ*fv(v;α)dv。让λ*= 最大{λ*, λ*}, 选择区域为{(y,σ):y≥ tα(λ)*, σ) }带tα(λ)*, σ) = θα/ρ - Φ-1(1 - λ*)pσ/ρ。Gu和Koenker 17假设我们使用θ的后验平均值作为排序工具,因此δPMi=1{yρ≥ ω*}对于一些适当选择的ω*这保证了产能和罗斯福的控制。对于容量约束,阈值解为1- α=ZP(yρ<ω)*)dH(σ)=ZΦω*/(σθqσθ+σ)dH(σ),而FDR控制需要求解的阈值γ=ZP(y≥ ω*/ρ、 θ<θα)dH(σ)/ZP(y≥ ω*/ρ) dH(σ)=Z[ω*/ρ,+∞)(1 - α) f(y)dydH(σ)/Z1- Φω*/(σθqσθ+σ)dH(σ),其中f(y)=1- αp2π(σθ+σ)expn-y2(σθ+σ)oΦ(θα- yρ)pρσ,表示零θ<θα下y的密度。

27
何人来此 在职认证  发表于 2022-4-26 16:14:10
设置ω*= 最大{ω*, ω*}, 选择区域是{(y,σ):y≥ ω*/ρ} .0.5 0.6 0.7 0.8 0.9 1.02.0 2.5 3.0 3.5 4.0 4.5 5 5.0选择边界σ阈值LFDR-CPM-CLfdr-FDRPM-FDR0。5 0.6 0.7 0.8 0.9 1.02.0 2.5 3.0 3.5 4.0 4.5 5 5.0能力约束σyAll agreed tail extraPM extra0。5 0.6 0.7 0.8 0.9 1.02.0 2.5 3.0 3.5 4.0 4.5 5 5.0 FDR约束σyAll agreed tail extraPM extraFigure 4.2。左面板绘制了σθ=1,α=0.05,γ=0.2的法线模型的选择边界。假设σ的密度在[0.5,1]范围内是均匀的。选定的单位必须在曲线上方有(yi,σi)。红色曲线对应于选择区域边界,FDR控制在0.2级;实线表示后验均值排序,虚线表示后验尾部概率排序。黑色曲线对应于选择边界,容量控制为0.05级。中间和右侧的面板显示了从10000大小的已实现样本中选择的集合。灰色圆圈对应于通过后验尾部概率规则和后验平均数规则选择的个体。绿色十字表示通过后验平均数规则选择的个体,而不是尾部概率;红色十字表示通过尾部概率规则选择的个体,而不是通过后验平均数规则选择的个体。18令人反感的比较图4.2用θ绘制了两个约束的选择边界~ N(0,1)与σ~ U[0.5,1]。当α=0.05和γ=0.2时,FDR约束是有约束力的,而不是容量约束。在本例中,如果我们仅将容量限制设置为5%,即使是完全了解G的Oracle,也将面临近52%的错误发现率。换句话说,选择在右尾的人中,有一半以上是θ<θα的个体,而不是来自预期的θ≥ θα群。

28
可人4 在职认证  发表于 2022-4-26 16:14:17
这一事实促使我们更明确地将罗斯福纳入选择约束。我们可能还记得,在齐次方差高斯设置中,我们在图3.1中看到,当α设置为0.05时,FDR也非常高。图4.2还描述了所选集合,其实现样本为正常模式下的10000个样本。仅在容量限制的情况下,后验平均值标准有利于方差较小的个体。当实施FDR约束时,γ=0.2,它将成为该设置中的约束,两个标准变得更严格,只选择了更小的个体集,并且选择中的冲突更少。相应的选定集绘制在图4的右面板中。2.当G中的方差参数σθ未观测到时,我们可以根据Y的边际似然通过Themmle进行估计。这就产生了Efron和Morris(1973)提出的广义James Steinestimator。实例[离散G]假设θ~ 0.85δ-1+ 0.1δ+ 0.05δ. 那么给定σ的y的边缘密度的形式为,f(y |σ)=Z|(y |θ,σ)dG(θ)=0.85|(y | 1,σ)+0.1|(y | 2,σ)+0.05|(y | 5,σ))。随机变量v是一对(y,σ)的变换,定义为,v=ψ(y,σ):=P(θ)≥ θα| y,σ)=R+∞θα|(y |θ,σ)dG(θ)R∞-∞ν(y |θ,σ)dG(θ)。容量约束导致v上的阈值规则,使得P(v≥ λ*) = α、 而FDR控制会产生一个截止值λ*定义为γ=E[(1-v) 1{v≥λ*}]/P(v)≥ λ*). 让λ*= 最大{λ*, λ*}, 然后用{(y,σ):y来定义选择区域≥ tα(λ)*, σ) },并且可以很容易地在数字上找到。图4.3绘制了当θ遵循该离散分布时两个约束的选择边界。我们再次设置α=0.05和γ=0.2,因此我们希望选择与最大影响大小相关的所有个体,{θ=5},同时将FDR率控制在20%以下。

29
何人来此 在职认证  发表于 2022-4-26 16:14:23
红色曲线再次对应于FDR控制和两级程序,而黑色曲线对应于容量控制。为了使这两个区域重叠,α固定在0.05,我们必须愿意容忍γ≈ 37%. 在这种情况下,我们看到后验概率排序程序优先选择方差较大的个体,而后验平均值排序程序优先选择方差较小的个体。基于已实现的10000个样本,图4.3再次显示了所选的观察结果,我们再次看到后验平均值标准有利于方差较小的个体,无论是在容量约束还是FDR约束下。与正常设置相比,现在FDR约束不那么严重,允许我们选择更多的个体。Gu和Koenker 190.5 1.0 1.5 2.0 2.5 3.0 3.5 4.02 4 6 8 10 12 14选择边界σ阈值LFDR-CPM-CLfdr-FDRPM-罗斯福●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.02 4 6 8 10 12 14容量约束σy●所有人都同意额外付费●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.02 4 6 8 10 12 14 FDR约束σy●所有人都同意,如图4.3所示。

30
nandehutu2022 在职认证  发表于 2022-4-26 16:14:29
左面板用θ绘制法线离散模型的选择边界~ G=0.85δ-1+0.1δ+0.05δ和α=0.05和γ=0.1。σ的密度在[0.5,4]范围内是均匀的。红色曲线对应于选择区域,FDR控制在0.2级,实线表示后验平均值排名,虚线表示后验尾概率。黑色曲线对应于capacitycontrol处于0.05级的选择区域。其他面板的结构如上图所示。5.异质未知方差假设σi已知,直到一个共同的标度参数,在某些应用中可能是合理的,例如棒球击球平均数,但通常更合理的观点是,我们只是面临可能来自纵向数据的标度估计。在这种情况下,我们需要考虑对(yi,Si)作为纵向模型产生的潜在联合相依随机变量,Yit=θi+σi信息技术信息技术~iidN(0,1),(θi,σi)~ G、 有了充分的统计数据,Yi=T-1optit=1yi和Si=(Ti- 1)-1tit=1(Yit- 对于(θi,σi)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 07:40