楼主: nandehutu2022
1999 68

[经济学] 一个自动有限样本稳健性度量:什么时候可以稍微降低 [推广有奖]

41
能者818 在职认证  发表于 2022-4-24 17:36:18
所有标准误差均以家庭为单位进行聚类,所有回归均使用可变权重_12m确定的调查权重进行加权。我们可以访问以下七个结果变量,这些变量按以下顺序出现在原始论文表9的B组中(以及我们的下表):自我报告的健康状况良好或非常好或优秀(不公平或差)的二元指标,自我报告的健康状况不差的二元指标,过去六个月健康状况大致相同或有所改善的二元指标,过去30天身体健康状况良好的天数,身体或心理健康状况不佳不影响日常活动的天数,过去30天心理健康状况良好的天数,以及过去两周没有抑郁的指标。我们完全复制了Finkelsteinet al.(2012)表9中的B组,既针对整个人群的ITT效应(β),也针对后期编者(π)。这两项分析都显示了对所有健康指标产生积极影响的有力证据,大多数p值远低于0.01.4.1.2 AMIP敏感性结果。对于Finkelstein等人(2012)表9中B组中的每个健康结果,我们计算AMIP,以评估需要删除多少数据点才能改变治疗效果的标志、治疗效果的重要性,或产生相反符号的显著结果。后期分析的敏感性如表1所示,ITT分析的敏感性如表2所示。在这两种情况下,我们都完全使用原始论文中的模型,包括所有固定的影响和控制,以及家庭层面的聚类。对于大多数结果,无论是后期分析还是ITT分析,都可以通过删除约0.5%的数据或大约22000个样本中的约100个数据点来改变治疗效果的迹象。

42
kedemingshi 在职认证  发表于 2022-4-24 17:36:25
最可靠的结果是,“健康优于公平”(“健康gen fl ip 12m”),需要去除略高于1%的样本以改变标志。在各种结果中,我们可以减少甚至更少的样本,以将结果从显著改变为不显著。在某些情况下,我们需要研究案例原始估计目标变化可靠性估计观察值下降符号变化-0.006(0.025)275=1.18%健康基因12 m0.133(0.026)*显著变化0.044(0.026)162=0.69%显著符号变化-0.043(0.024)381=1.63%符号变化-0.003(0.015)155=0.66%健康非穷人12 m0.099(0.018)*显著变化0.027(0.016-0.030(0.015)*219=0.94%符号变化-0.006(0.022)197=0.84%健康变化flip 12m 0.113(0.023)*重大变化0.039(0.022)106=0.45%重大符号变化-0.049(0.022)*291=1.24%符号变化-0.023(0.535)73=0.33%不坏天数总计12m 1.317(0.563)*重大变化1.078(0.558)10=0.05%显著符号变化-1.009(0.521)144=0.66%符号变化-0.040(0.577)87=0.41%不差日生理变化-1.585(0.606)*显著变化1.131(0.597)20=0.09%显著变化-1.141(0.566)*164=0.77%符号变化-0.062(0.607)123=0.57%不差日心理变化12.082(0.640)*显著变化1.171(0.625)42=0.19%显著变化-1.201(0.594)*212=0.005(0.05)符号变化-0.05显著性变化0.046(0.024)42=0.18%显著性变化-0.050(0.023)*220=0.95%表1:一系列结果变量的静脉注射医疗补助支持结果。“Re fi testimate”列显示了重新拟合模型的结果,删除了近似的最大流集。星星表示在5%水平上的重要性。

43
能者818 在职认证  发表于 2022-4-24 17:36:31
实现了预期变化的公司以粗体显示。研究案例原始估计目标变化不确定性估计观察值下降符号变化-0.004(0.008)286=1.22%健康基因变化12m 0.039(0.008)*显著变化0.013(0.008)163=0.70%显著变化-0.021(0.008)*422=1.81%符号变化-0.001(0.005)156=0.67%健康非贫困者12m 0.029(0.005)*显著变化0.008(0.0.007)0.007)0.007)0.007)0.007)0.007)0.007)0.007)0.007(0.007)3(0.007)6)重大变化0.011(0.007)0.007)106)106(10.007)106(10)106)106(10)106)106(10)106(10)106(10)10)10)10)10)10(0.11)10)10)10(0(0.007)10)10)10)10)10)10)10)10)10)10)10)10)10(0.007)106)106)106)106(10)106(10)106(10)106(10)106)106)106(10)106(10)106(10)106(10)10)10)106)10)10)10)10)106(10)106(10)106(10)10)10)10)10)10)10)10)10)10)10(1)88=0.41%的不坏日子身体变化0.459(0.175)*显著变化0.328(0.172)20=0.09%的显著体征变化-0.344(0.165)*166=0.78%的体征变化-0.027(0.178)124=0.57%的不坏日子心理变化12m0.603(0.184)*显著变化0.340显著性变化0.013(0.007)43=0.19%显著性变化-0.015(0.007)*225=0.97%表2:一系列结果变量的OLS医疗补助支持结果。“Re fi testimate”列显示了重新拟合模型的结果,删除了近似的最大流集。星星表示在5%水平上的重要性。实现了预期变化的公司以粗体显示。仅删除10或20个数据点,以影响重大变化。最后,对于大多数结果,我们可以删除不到1%的数据,以产生相反符号的显著结果。

44
能者818 在职认证  发表于 2022-4-24 17:36:37
仅有的两个例外情况“Health gen fl ip 12m”和“Health change fl ip 12m”要求去除略高于1%的元素,以产生相反符号的显著结果。在手动删除近似最具影响力集中的数据点后,我们通过重新运行模型来检查每次分析的近似性能。该程序的结果显示在表1和表2的“收益估算”栏中。对于每个表中的几乎每一个结果,我们的近似度量都可靠地揭示了确实提供了所声称的更改的数据点的组合。正如我们在第2.2.1节中所讨论的,表1和表2的“估计误差”列中记录的变化构成了真实最坏情况下有限样本灵敏度的下限。通过表1和表2的比较,我们发现ITT结果(估计的viaOLS)并不明显比后期结果(通过IV估计)更具AMIP稳健性。基于一种启发性的信念,这似乎首先是违反直觉的,即IV在某种意义上不如有限样本中的OLS“稳健性”分析:例如,最近的作者,包括Young(2019),表明在有限样本中,IV的不确定度区间可能比OLS的区间校准得更差。然而,正如我们在第3节中所讨论的,在有限样本估计量的意义下,提供一个良好的渐近量近似值的“鲁棒性”的质量与AMIP鲁棒性完全无关。AMIP本身的大小和AMIP近似的准确性都不取决于渐近参数(参见第3.2.2节第(a)段和定理1的讨论)。AMIPM测量特定数据集上特定程序对数据消蚀的敏感性,并与所选感兴趣数量的精确性无关,达到某种渐近极限。

45
kedemingshi 在职认证  发表于 2022-4-24 17:36:43
因此,从有限样本覆盖率低的角度来看,IV等程序可能是“不稳健的”(正如Young(2019年)报告的那样),但仍具有AMIP稳健,反之亦然。“稳健性”的两个概念截然不同。4.2现金转移我们接下来将表明,即使剔除异常值,实证分析仍然可以是AMIP非稳健的。为此,我们应用我们的技术来检验Angelucci和De Giorgi(2009)主要分析的稳健性,这是一项流动性研究,显示了现金转移对同一村庄中不合格(“非贫困”)户主的影响,也称为“溢出效应”由于担心最大值的影响,作者削减了非贫困家庭的消费结果。然而,尽管对贫困家庭的分析相当可靠,但对《削减协议》实际影响的非贫困家庭的分析要敏感得多。4.2.1背景和复制Angelucci和De Giorgi(2009)采用随机对照试验研究Progresa的影响,Progresa是一个向墨西哥合格贫困家庭提供现金礼物的社会项目。随机化发生在村一级。因此,我们既可以估计对被选中接受Progresa的贫困家庭的主要影响,也可以估计对与接受Progresa的贫困家庭位于同一村庄的不合格“非贫困”家庭的影响。本文的主要结果表明,无论是作为合格家庭还是不合格家庭的一项指标,PROGRESA对家庭总消费都有强烈的积极影响;见Angelucci and de Giorgi(2009)的表1。变量C_inditdenotes表示时间段t内家庭i的家庭总消费量。C_inditdenote的值超过10000被删除;从定义上讲,这些住宅区并不贫穷。

46
能者818 在职认证  发表于 2022-4-24 17:36:49
作者分别研究了三个不同的时间段,以检测短期和长期影响之间的任何变化。它们以大量变量为条件(家庭贫困指数、土地面积、户主性别、年龄、家庭是否会说母语和识字率;在地方一级,贫困指数和住房数量),以帮助确保治疗村和对照村的家庭之间进行公平比较。在这种情况下,这些控制很重要;包括对照组时,对“非贫困”家庭的影响在5%水平上是显著的,但在dummyfor治疗状态的简单回归中,在10%水平上是显著的。由于杂志和作者的开放数据政策,论文的完整数据可在《美国经济评论》网站上查阅。我们可以成功地复制有对照组和无对照组的分析结果,并根据原始作者的首选规范继续进行我们目前的分析中的对照组。我们考虑的时间段索引为T=8, 9,10在所提供的数据集,虽然我们注意到,作者不依赖于结果T=8,因为推出仍在进行中。我们使用K个控制变量,其中xitkis是t期间家庭i的第K个变量。

47
何人来此 在职认证  发表于 2022-4-24 17:36:56
然后我们运行以下回归:C_indit=β+βtreatpoor,i+βtreatnonpoor,i+KXk=1β2+kXitk+信息技术这里,treatpoor指的是治疗指标和贫困家庭指标之间的相互作用;相应地,treatnonpoor是指治疗指标和非贫困家庭指标之间的相互作用。我们能够准确地复制Angelucci和De Giorgi(2009)表1的结果,该结果显示了现金转移的积极影响。研究案例原始估计目标变化-效果估计观察值下降符号变化-0.656(3.745)252=2.30%差,期间817.312(4.576)*显著变化7.284(4.087)83=0.76%显著符号变化-7.212(3.443)*464=4.24%符号变化-1.377(4.406)345=3.58%差,第9期27.924(5.770)*显著变化7.077(4.555)146=1.52%显著符号变化-8.951(4.251)*588=6.11%符号变化-2.559(3.541)697=6.63%贫困,第10期33.861(4.468)*显著变化4.806(3.684)435=4.14%显著符号变化-9.416(3.296)*986=9.37%符号变化0.410%,期间8-5.444(7.133)重大变化-12.845(6.635)16=0.35%重大迹象变化9.670(5.573)24=0.52%迹象变化-0.365(7.542)21=0.55%非贫困,期间9 22.852(10.000)*重大迹象变化16.506(9.114)3=0.08%重大迹象变化-11.733(7.113)53=1.38%迹象变化-0.573(6.70%)非贫困,第10期21.493(9.405)*显著变化16.262(8.927)3=0.07%显著变化-10.845(6.467)92=2.16%表3:不同时期和治疗组的现金转移结果。“Re fi testimate”列显示了重新拟合模型的结果,删除了近似的最大流集。星星表示在5%水平上的重要性。

48
mingdashike22 在职认证  发表于 2022-4-24 17:37:02
实现了预期变化的公司以粗体显示。4.2.2 AMIP敏感性结果我们应用我们的方法来评估需要删除多少数据点来改变符号、显著性,或产生与完整样本中发现的相反符号的显著结果。我们关注后两个时间段,ashouseholds在第一个时间段仅收到部分转让,但我们展示了这三个时间段,以便从原始论文中复制表1。表3显示了我们的结果。关注第9期和第10期,我们发现对贫困家庭的直接影响的推断相当可靠,但对间接影响的推断则不那么可靠。对于穷人的分析,通常需要去除超过1%的样本才能改变结论。对于非预期的分析,我们可以删除不到0.5%的数据来改变结论。事实上,在大约10000个家庭的样本中,我们只能删除3个数据点,以改变t=9和t=10的重要状态。我们再次检查近似值的质量。表3中的“重新估算”列显示了删除复杂数据点后手动重新运行每个分析的结果。在大多数情况下,AMIP正确识别了一组数据点,这些数据点可以对研究结论做出声称的更改。虽然有少数情况下,重新运行分析无法产生预测的具有统计意义的符号变化,但观察到的变化仍然很大,没有实际意义。此外,删除几个额外的点可能实际上会产生所需的具有统计意义的标志反转。最后,我们注意到,这些结果说明了总错误鲁棒性与AMIP鲁棒性的区别(见第3.2.3节,第(e)段)。

49
nandehutu2022 在职认证  发表于 2022-4-24 17:37:08
回想一下,Angelucci和De Giorgi(2009)删除了消费量超过10000的(非差)数据点。通过以这种方式去除消耗变量的异常值,本研究的作者做出了一个通常被认为是保守的选择,考虑到关于粗差敏感性的经典稳健性问题。然而,正如我们在表3中所示,关于非贫困家庭的定性结论对于去除少量数据点仍然不稳健,这从经验上证明,仅仅通过去除异常值,不一定能使分析AMIP稳健。事实上,正如我们在上文第3.1节中所示,如果信噪比太低,即使是没有异常数据点的完全指定OLS回归也可能是AMIP非稳健的。4.3小额信贷的七项随机对照试验:线性回归分析我们现在表明,即使是一个简单的双参数线性模型,在随机试验的治疗组和对照组之间进行均值比较,也可能具有高度敏感性。为此,我们考虑分析七个随机对照试验扩大小额信贷,RST聚集在微薄(2019)。在下面的第4.4节中,我们将在相同的数据上考虑更复杂的贝叶斯层次模型。4.3.1背景七项小额信贷研究中的每一项都是在不同的国家进行的,每项研究都选择了某些社区,以随机获得更多的小额信贷。研究人员要么建立一个分支机构,要么将建立一个分支机构与一些积极的外联活动结合起来,要么在申请者中随机选择借款人。选定的研究包括:Angelucci等人(2015年)、Attanasio等人(2015年)、Augsburg等人(2015年)、Banerjee等人(2015年)、Crépon等人(2015年)、Karlan和Zinman等人(2011年)以及Tarozzi等人(2015年)。

50
何人来此 在职认证  发表于 2022-4-24 17:37:14
其中六项研究发表在《美国经济学杂志:小额信贷应用经济学》的特刊上。所有七项研究加在一起通常被认为是理解小额信贷影响的最坚实的证据基础。我们遵循原始研究和米格尔(2019)分析了小额信贷作为利息处理的影响。这些研究的样本范围从蒙古的约1000户家庭(Attanasio等人,2015年)到墨西哥的约16500户家庭(Angelucci等人,2015年)。我们首先关注的是关于家庭商业利益的头条新闻结果,该结果在一个截距和一个二元变量上回归,表明一个家庭是被分配到治疗组还是控制组。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-31 14:53