楼主: nandehutu2022
1997 68

[经济学] 一个自动有限样本稳健性度量:什么时候可以稍微降低 [推广有奖]

61
大多数88 在职认证  发表于 2022-4-24 17:38:24
20世纪的许多统计数据都关注标准误差和抽样不确定性,它们起源于随机农业试验的背景下,其中多个领域的产量差异通过独立的抽样变异得到了很好的建模。与缓解贫困的经济干预试验相比,随机抽样个人或社区是一项挑战,干预措施可能适用于非常不同的环境。在应用经济学中,统计模型通常旨在为干预措施的影响提供易于理解的总结。通过这样做,模型可以以不反映政策利益的方式在个人之间平均信息。因此,为了使我们的方法能够安全地为经济政策决策提供信息,我们还需要在农业试验中,总产量是真正的利益量;对于小额信贷试验,平均治疗效果只是一个方便的总结。如果一个人的富裕程度稍有增加,而另一个人则变得贫穷,就可以考虑干预措施。相比之下,如果一株植物能产出相当于整个收获期的玉米,结果仍然是令人满意的,尽管有些奇怪。超出标准错误的工具。在本文中,除了标准误差之外,我们提供了一种设想和量化实证结果对样本数据依赖性的替代方法。根据我们的标准,结论对数据删除的敏感性并不一定意味着样本存在问题。但推理的目的不是了解样本,而是了解人口。

62
mingdashike22 在职认证  发表于 2022-4-24 17:38:30
如果样本的微小改变可以在推断中产生重大变化,并且我们知道我们从事经济学的环境一直在变化,那么我们应该不那么确信,我们已经了解了我们寻求了解的更广泛人群的一些基本情况,我们最终寻求为他们制定政策。我们的意思并不是说,根据经典抽样理论,原始分析是无效的,我们也不建议研究人员放弃原始的全样本结果,即使根据我们的标准,这些结果并不可靠。然而,报告我们的指标和标准误差将提高我们理解和解释给定分析结果的能力。由于AMIP分析总是指出哪些数据点具有高(近似)影响,我们的方法不仅让研究人员有机会检查近似方法是否对他们自己的样本有效,而且让研究人员了解这些数据点的特殊性。调查影响点可以深入了解给定的推理程序是如何使用有限样本信息来生成有关总体参数的主张的。此外,当这种敏感性不受欢迎时,开发新的统计方法来改善这种敏感性可能是有益的。鉴于经济学研究的实际目标和用途,开发这些方法似乎尤其重要,而不是依赖于与应用社会科学实践几乎没有相似之处的经典重抽样范式。参考Angelucci,M.和De Giorgi,G.(2009)。援助计划的间接影响:现金转移如何影响不合格者的消费?《美国经济评论》,99(1):486-508。Angelucci,M.,Karlan,D.,和Zinman,J.(2015)。小额信贷影响:来自CompartamosBanco的随机小额信贷项目安置实验的证据。

63
可人4 在职认证  发表于 2022-4-24 17:38:36
美国经济杂志:应用经济学,7(1):151-82。O.阿塔纳西奥、B.奥格斯堡、R.德哈斯、E.菲茨西蒙斯和H.哈姆加特(2015年)。小额融资的影响:来自蒙古连带责任贷款的证据。美国经济杂志:应用经济学,7(1):90-122。B.奥格斯堡、R.德哈斯、H.哈姆加特和C.梅吉尔(2015年)。小额信贷的影响:来自波斯尼亚和黑塞哥维那的证据。美国经济杂志:应用经济学,7(1):183-203。A.班纳吉、E.杜弗洛、R.格伦内斯特和C.金南(2015年)。小额融资的奇迹?来自随机评估的证据。美国经济杂志:应用经济学,7(1):22-53。Baydin,A.,Pearlmutter,B.,Radul,A.,和Siskind,J.(2017)。机器学习中的自动区分:综述。机器学习研究杂志,18(1):5595–5637。Blei,D.,Kucukelbir,A.,和McAuli Affe,J.(2017年)。变分推理:统计学家综述。《美国统计协会杂志》,112(518):859-877。Carpenter,B.,Gelman,A.,Ho Off-man,M.,Lee,D.,Goodrich,B.,Betancourt,M.,Brubaker,M.,Guo,J.,Li,P.,和Riddell,A.(2017年)。斯坦:一种概率编程语言。《统计软件杂志》,76(1)。Chatterjee,S.和Hadi,A.(1986年)。流动观察、高杠杆点和线性回归中的异常值。统计科学,1(3):379-393。Chen,X.,Tamer,E.,和Torgovitsky,A.(2011)。半参数似然模型中的灵敏度分析。考尔斯基金会讨论论文。克雷蓬,B.,德瓦托,F.,杜弗洛,E.,和帕伦特,W.(2015)。估计小额信贷对接受者的影响:来自摩洛哥随机实验的证据。美国经济杂志:应用经济学,7(1):123-50。德布鲁恩,N.(1981)。分析中的渐近方法,第4卷。

64
mingdashike22 在职认证  发表于 2022-4-24 17:38:43
快递公司。Finkelstein,A.,Taubman,S.,Wright,B.,Bernstein,M.,Gruber,J.,Newhouse,J.,Allen,H.,Baicker,K.,和Group,O.H.S.(2012)。俄勒冈州医疗保险实验:第一年的证据。《经济学季刊》,127(3):1057-1106。乔丹诺,R.,布罗德里克,T.,和乔丹,M.I.(2018)。协方差、稳健性和变分贝叶斯。机器学习研究杂志,19(1):1981-2029。乔丹诺,R.,乔丹,麻省理工和布罗德里克,T.(2019a)。一种高阶的瑞士袖珍折刀。arXiv预印本arXiv:1907.12116。乔丹诺,R.,斯蒂芬森,W.,刘,R.,乔丹,M.I.,和布罗德里克,T.(2019b)。一支穿着小型折刀的瑞士军队。第22届国际人工智能与统计会议,第1139-1147页。PMLR。古斯塔夫森,P.(2000年)。贝叶斯分析中的局部稳健性。在稳健贝叶斯分析中,第71-88页。斯普林格。汉佩尔,F.(1974)。影响曲线及其在稳健估计中的作用。《美国统计协会杂志》,69(346):383-393。汉佩尔,F.(1986)。稳健统计:基于影响函数的方法,第196卷。威利跨科学。汉森,L.和萨金特,T.(2008)。健壮性。普林斯顿大学出版社。He,X.,Jurecková,J.,Koenker,R.,和Portnoy,S.(1990年)。回归估计量的尾部行为及其分解点。计量经济学:计量经济学学会杂志,1195-1214页。Huber,P.(1967年)。极大似然估计在非标准条件下的行为。《第五届伯克利数学统计与概率研讨会论文集:天气修正》,第5卷,第221页。加利福尼亚大学出版社。Huber,P.(1981)。可靠的统计数据。约翰·威利父子公司,纽约。卡兰·D.和津曼·J.(2011)。理论和实践中的小额信贷:使用随机信用评分进行影响评估。《科学》,332(6035):1278-1284。南卡罗来纳州将军。

65
能者818 在职认证  发表于 2022-4-24 17:38:49
和Parks,H.(2012年)。隐函数定理:历史、理论和应用。斯普林格科学与商业媒体。Kucukelbir,A.,Tran,D.,Ranganath,R.,Gelman,A.,和Blei,D.(2017年)。自动微分变分推理。机器学习研究杂志,18(1):430-474。莱默,E.(1984)。广义最小二乘估计的全局灵敏度结果。《美国统计协会杂志》,79(388):867-870。莱默,E.(1985)。敏感性分析会有所帮助。《美国经济评论》,75(3):308-313。麦克劳林、杜维诺和亚当斯(2015)。Autograd:在numpy中进行轻松渐变。在ICML 2015 AutoML研讨会上,第238卷。马斯滕,M.和波里耶,A.(2020年)。关于崩溃边界的推论。数量经济学,11(1):41-111。米格尔,R.(2019)。理解小额信贷扩张的平均影响:七个随机实验的贝叶斯层次分析。美国经济杂志:应用经济学,11(1):57-91。米格尔,R.(2020年)。聚合分配处理效果:小额信贷文献的贝叶斯层次分析。伦敦经济学院的工作文件。Mosteller,F.和Tukey,J.(1977年)。数据分析和回归:统计学的第二门课程。皮尔逊,美国。里德斯,J.(1976)。关于冯·米塞斯泛函的定义。哈佛大学统计学博士论文。Rigollet,P.(2015年春季)。课程18。s997高维统计。麻省理工学院:麻省理工学院开放软件,https://ocw.mit.edu/.Accessed: 2021-08-24.Saltelli,A.(2004年)。全球敏感性分析:导论。在程序中。第四届模型输出灵敏度分析国际会议(SAMO\'04),第27-43页。Ser Fling,R.(2009年)。《数理统计近似定理》,第162卷。约翰·威利父子公司。索波尔,I.(2001)。非线性数学模型的全局灵敏度指数及其蒙特卡罗估计。

66
nandehutu2022 在职认证  发表于 2022-4-24 17:38:56
《模拟中的数学与计算机》,55(13):271–280。Stefanski,L.和Boos,D.(2002年)。M-估计的演算。美国统计学家,56(1):29-38。Tarozzi,A.,Desai,J.,和Johnson,K.(2015)。小额信贷的影响:来自埃塞俄比亚的证据。美国经济杂志:应用经济学,7(1):54-89。范德法特,A.(2000年)。渐近统计,第3卷。剑桥大学出版社。威尔逊,A.,凯西,M.,和麦基,L.(2020)。近似交叉验证:模型评估和选择的保证。艺术情报与统计国际会议,第4530-4540页。PMLR。杨,A.(2019)。没有推论的一致性:实际应用中的工具变量。http://personal.lse.ac.uk/YoungA/CWOI.pdf.访问时间:2020-1127。于斌(2013)。稳定性伯努利,19(4):1484-1500。附录A详细证明请参见附录1。让我们,NPNN=1的χNbe实值标量χn=1。然后呢~w∈WαNPNn=1 | ~wn- 1 |χn≤√α.证据在不丧失普遍性的情况下,让χnbe唯一(如果不是唯一的,则添加非常小的抖动以打破联系),然后让q1-α表示它们的d(1)-α) 净最大值。最大值max~w∈WαNPNn=1 | ~wn- 1 |χn在~w处达到,将所有{n:χn的权重设置为零≥ q1-α} ,somax~w∈WαNNXn=1 | ~wn- 1 |χn=NNXn=1I(χn≥ q1-α) χn.让^Fχ表示数据dn上χn条件的经验分布,并注意q1-α固定在^Fχ中。将Cauchy-Schwartz应用于前面的显示,分布^FχgivesNNXn=1I(χn≥ q1-α) χn≤vuutNNXn=1I(χn≥ q1-α) vuutNNXn=1χn=sbNαcN≤√α、 sinceNPNn=1χn=1,且最多bαNc点大于q1-α.以下引理满足Giordano等人(2019b)的条件1。引理2。让我们*α:={~1+t(~w-~1) :~w∈ Wα,t∈ [0,1]}在假设3下,max~w∈W*αsupθ∈OhmθNNXn=1(~wn)- 1) G(θ,dn)≤√DCgh√α和max~w∈W*αsupθ∈OhmθNNXn=1(~wn)- 1) H(θ,dn)≤√DCgh√α.证据

67
能者818 在职认证  发表于 2022-4-24 17:39:02
证明了G(θ,dn)的结果;H(θ,dn)的证明如下。通过三角不等式和k·k和k·k之间的关系,NNXn=1(~wn)- 1) G(θ,dn)≤√DCghNNXn=1 | ~wn- 1 | kG(θ,dn)kCgh。应用引理1和χn:=kG(θ,dn)kcGHT来控制Wα上和的最大值。最后,将结果推广到W*αsincemax~w∈W*αNNXn=1 | ~wn- 1 |χn=maxt∈[0,1]最大~w∈WαNNXn=1 | t(~wn)- 1) |χn=max~w∈WαNNXn=1 |(~wn)- 1) |χn.我们需要以下引理将Giordano等人(2019b)定理1的结果推广到光滑函数。引理3。假设3和4成立。对于足够小的α,存在恒定的Cb<∞ 这样,对于任何一个∈ RN,max~w∈W*αd^θ(~w)d~wT~W-d^θ(~w)d~wT~!A.≤ Cbkak√N√α.证据在定理1的证明中,对于剩余的证明,假设α≤DCgh,并观察Giordano等人(2019b)的假设1-5和条件1是否满足。在本证明期间,定义简写符号h(~w):=NNXn=1~wnH(^θ(~w),dn)和G(~w):=NNXn=1anG(^θ(~w),dn)。然后,根据Giordano等人(2019b)的结果,d^θ(~w)d~wT~W-d^θ(~w)d~wT~!A.=-H(~w)-1G(~w)+H(~1)-1G(~1)(提案4)≤-(H(~w)-1.- H(~1)-1) G(~w)+H(~1)-1(G(~1)-G(~w))≤-(H(~w)-1.- H(~1)-1) G(~w)+ 警察。(条件1,假设2)然后,(H(~w)-1.- H(~1)-1) G(~w)=H(~w)-1.H(~1)-H(~w)H(~1)-1G(~w)≤ 2CopH(~1)-H(~w)G(~w)(假设2,引理6)≤ 2Cop√D(1+DCwLhCop)δkG(~w)k(引理5,矩阵范数)=2Cop√D(1+DCwLhCop)δNNXn=1anG(^θ(~w),dn)≤ 2Cop√D(1+DCwLhCop)δCghkak√N.(假设3,Cauchy-Schwartz)组合,并使用引理2给出δ=√DCgh√α、 给出期望的结果。定理1的证明。在证明期间,确定线性近似值^θlin(~w):=^θ+d^θ(~w)d~wT~(~w)-~1). 假设3相当于Giordano等人的假设1-4。

68
nandehutu2022 在职认证  发表于 2022-4-24 17:39:08
(2019b),引理2用δ满足Giordano等人(2019b)的条件1=√DCgh√α. Giordano等人(2019b)的假设5在Cw=1时满足Wα。定义,如Giordano等人(2019b)所述,CIJ:=1+DLhCopand := 明尼苏达州θC-1op,C-1件-Giordano等人(2019b)的引理3和定理1分别给出了thatmax~w∈W*α^θ(~w)-^θ≤ 警察√DCgh√α和(27)α≤DCgh=> 麦克斯~w∈W*α^θlin(~w)-^θ(~w)≤ 2CopCIJDCghα。(28)对于剩余的证明,假设α≤DCGH使等式28适用。对于任何~w∈ Wα,定义ω(t):=~1+t(~W-~1) ∈ W*α. 根据微积分的基本理论,φ(^θ(~w),~w)-^φ=Zdφ(ω(t))dttdt=Zdφ(ω(t))dtT-dφ(ω(t))dtdt+dφ(ω(t))dt.(29)式中,根据链式法则,dφ(ω(t))dtt=φ(θ,ω(t))θT^θ(ω(t))d^θ(~w)d~wTω(t)(~w)-~1) +φ(^θ(ω(t)),~w) ~wTω(t)(~w)-~1).对于屋顶的其余部分,采用特定的“大O”符号将非常有用,我们指的是以下内容。如果我们写x=O(√α) 对于某些数量x,我们的意思是存在一个常数C,作为假设3和4中定义的常数的闭合形式函数,例如x≤ C√α代表所有α≤DCgh。x=O(α)也有类似的表示法。这种“大O”符号可以用通常的方式操作(De Bruijn,1981)。首先,通过定义Wα,我们有max~W∈WαNPNn=1(~wn)- 1) =bαNcN≤ α、 所以麦克斯~w∈Wα(~w)-~1)/√N≤√α.接下来,观察等式。

69
大多数88 在职认证  发表于 2022-4-24 17:39:15
27和28加在一起意味着Max~w∈W*αd^θ(~w)d~wT~(~w)-~1)≤ 麦克斯~w∈W*α^θlin(~w)-^θ(~w)+ 麦克斯~w∈W*α^θ(~w)-^θ= O(√α).通过下面的引理3,我们得到了最大值∈[0,1]最大~w∈W*αd^θ(~w)d~wTω(t)-d^θ(~w)d~wT~(~w)-~1)≤ Cb~W-~√N√α=O(α)。通过三角形不等式,将前两种显示结合起来,得出∈[0,1]最大~w∈W*αd^θ(~w)d~wTω(t)(~w)-~1)= O(√α).最后,根据假设4中偏导数的Lipschitz性质,我们得到了∈[0,1]φ(θ,ω(t))θ^θ(ω(t))-φ(θ,~1)θ^θ= O(√α) 和Maxt∈[0,1]√Nφ(^θ(ω(t)),~w) ~Wω(t)-φ(^θ,~w) ~W~= O(√α).同样,具有φat~w=~1偏导数有界性的三角形不等式意味着Maxt∈[0,1]φ(θ,ω(t))θ^θ(ω(t))还有maxt∈[0,1]√Nφ(^θ(ω(t)),~w) ~Wω(t)= O(√α).综合以上结果,得出最大值∈[0,1]dφ(ω(t))dtT= O(√α) 还有maxt∈[0,1]dφ(ω(t))dtT-dφ(ω(t))dt= O(α),由此得出所需结论,式29。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-31 13:16