楼主: 何人来此
2513 50

[经济学] 样本选择模型的双机器学习 [推广有奖]

41
能者818 在职认证  发表于 2022-4-24 18:00:38
W.和J.M.Wooldridge(2009):“项目评估计量经济学的最新发展”,《经济文献杂志》,47,5-86。Lechner,M.(2009):“劳动力市场项目评估的顺序因果模型”,《商业与经济统计杂志》,第27、71–83页。Lechner,M.和C.Wunsch(2013):“基于匹配的项目评估对控制变量可用性的敏感性”,劳动经济学,21111-121。Lee,D.S.(2009):“培训、工资和样本选择:估计锐利的边界影响”,经济研究综述,第761071-1102页。Levy,J.(2019):“教程:推导大型模型的效率影响曲线”,arXiv预印本arXiv:1903.01706。Little,R.和D.Rubin(1987):缺失数据的统计分析。威利,纽约。Little,R.J.A.(1995):“重复测量研究中的辍学机制建模”,《美国统计协会杂志》,901112-1121。Luo,Y.和M.Spindler(2016):“高维LBoosting:收敛速度”。Negi,A.(2020):“非随机分配和缺失结果的双加权M估计”,arXiv预印本arXiv:2011.11485。Newey,W.,J.Powell和F.Vella(1999):“三角同时方程模型的非参数估计”,计量经济学,67565–603。Newey,W.K.(2007):“非参数连续/离散选择模型”,《国际经济评论》,第481429-1439页。奈曼,J.(1959):复合统计假设的最优渐近检验。416–444.威利。Robins,J.(1986):“持续暴露期死亡率研究中因果推断的新方法——应用于健康工人幸存者效应的控制,”Mathematical Modeling,71393–1512。Robins,J.,A.Rotnitzky和L。

42
nandehutu2022 在职认证  发表于 2022-4-24 18:00:44
赵(1995):“缺失数据情况下重复结果的半参数回归模型分析”,《美国统计协会杂志》,90106-121。Robins,J.M.(1998):“边际结构模型”,1997年《美国统计协会学报》,贝叶斯统计科学部分,第1-10页。Robins,J.M.,S.D.Mark和W.K.Newey(1992):“通过模拟基于混杂因素的暴露预期来估计暴露影响”,生物特征学,48479–495。Robins,J.M.,A.Rotnitzky和L.Zhao(1994):“当一些回归系数不总是被观察到时,回归系数的估计”,《美国统计协会杂志》,90846–866。Rubin,D.(1980):“D.Basu对‘实验数据的随机化分析:鱼群化测试’的评论”,《美国统计协会杂志》,75591-593。鲁宾·D·B.(1974):“在随机和非随机研究中评估治疗的因果效应”,《教育心理学杂志》,66688-701。(1976):“推断和缺失数据”,Biometrika,63581-592。Schochet,P.,J.Burghardt和S.Glazerman(2001):“国家就业团队研究:就业团队对参与者就业和相关结果的影响”,华盛顿特区报告:Mathematica Policy Research,Inc.Schochet,P.,J.Burghardt和S.McConnell(2008):“就业团队有效吗?来自国家就业团队研究的影响发现”,《美国经济评论》,981864-1886年。塞门诺娃,V.(2020):“更好的李边界”,arXiv预印本arXiv:2008.12720。Shah,A.,N.Laird和D.Schoenfeld(1997):“具有可能缺失数据的多特征随机效应模型”,《美国统计协会杂志》,92775–779。Sloczy\'nski,T.和J.M.Wooldridge(2018):“预防平均治疗效果的一般双重稳健性结果”,计量经济学理论,34112-133。范德兰,M。

43
nandehutu2022 在职认证  发表于 2022-4-24 18:00:50
J.E.C.Polley和A.E.Hubbard(2007):“超级学习者”,统计学在遗传学和分子生物学中的应用,6。Wager,S.和S.Athey(2018):“使用随机森林对异质治疗效果的估计和推断”,《美国统计协会杂志》,1131228-1242。Wooldridge,J.(2002):“样本选择、损耗和分层的逆概率加权M估计,”葡萄牙经济杂志,1411-162。(2007):“一般缺失数据问题的逆概率加权估计”,《计量经济学杂志》,1411281-1301。Zhang,J.,D.Rubin和F.Mealli(2009):“基于可能性的职业培训项目因果效应分析,采用主要分层法”,《美国统计分类杂志》,104166–176。附录定理证明对于定理1、2和3的证明,有必要在Chernozhukov、Chetverikov、Demirer、Du flo、Hansen、Newey和Robins(2018)中验证定理3.1和3.2的假设3.1和3.2以及推论3.2的条件。P上的所有界都一致成立∈ P、 其中P是所有可能的概率定律的集合,为了简洁起见,我们省略了P。A.1定理1的证明将干扰参数定义为函数η=(pd(X)、π(D,X)、u(D,S,X)),其中pd(X)=Pr(D=D | X)、π(D,X)=Pr(S=1 | D,X)和u(D,S,X)=E[Y | D,S,X]。反事实ψd0=E[Y(d)]的内曼正交积分函数由以下表达式给出,其中W=(Y·S,d,S,X):ψd(W,η,ψd0)=I{d=d}·S·[Y- u(d,1,X)]pd(X)·π(d,X)+u(d,1,X)- ψd0。

44
nandehutu2022 在职认证  发表于 2022-4-24 18:00:57
(A.1)设tn为所有η=(pd,π,u)的集合,由P-平方可积函数pd,π,u组成,使得kη- ηkq≤ C、 (A.2)kη- ηk≤ δn,kpd(X)- 1/2k∞≤ 1/2 - ,kπ(D,X)- 1/2)k∞≤ 1/2 - ,ku(D,S,X)- u(D,S,X)k×kpd(X)- pd0(X)k≤ δnn-1/2,ku(D,S,X)- u(D,S,X)k×kπ(D,X)- π(D,X)k≤ δnn-1/2.我们进一步替换序列(δn)n≥1by(δn)n≥1,式中δn=C最大值(δn,n)-1/2),其中C是一个非常大的常数,只依赖于C和.假设3.1:线性分数和奈曼正交假设3.1(a)力矩条件:力矩条件Ehψd(W,η,ψd0)i=0成立:Ehψd(W,η,ψd0)i=E“=E[[Y-u(d,1,X)|d=d,S=1,X]=0z}{E“I{d=d}·S·[Y- u(d,1,X)]pd0(X)·π(d,X)X#+u(d,1,X)- ψd0#=E[u(d,1,X)]- ψd0=0,其中第一个等式遵循迭代期望定律。假设3.1(b)线性:分数ψd(W,η,ψd0)在ψd0中是线性的:ψd(W,η,ψd0)=ψad(W,η)·ψd+ψbd(W,η)与ψad(W,η)=-1和ψbd(W,η)=I{D=D}·S·[Y- u(d,1,X)]pd0(X)·π(d,X)+u(d,1,X)。假设3.1(c)连续性:映射η7的二阶Gateaux导数的表达式→ (A.11)中给出的E[ψd(W,η,ψd0)]是连续的。假设3.1(d)内曼正交性:对于任何η∈ Tn,η方向上的Gateaux导数- η=(π(D,X)-π(D,X),pd(X)- pd(X),u(D,S,X)- u(D,S,X)由下式给出:Eψd(W,η,ψd)η - η=- E“I{D=D}·S·[u(D,1,X)- u(d,1,X)]pd0(X)·π(d,X)#(*)+ E[u(d,1,X)- u(d,1,X)](**)- E“E[·| X]=E[Y-u(d,1,X)|d=d,S=1,X]=0z}{I{d=d}·S·[Y]- u(d,1,X)]pd0(X)·π(d,X)·pd(X)- pd0(X)pd0(X)#- E“E[·| X]=0z}{I{D=D}·S·[Y- u(d,1,X)]pd0(X)·π(d,X)·π(d,X)- π(d,X)π(d,X)#=0。Gateaux导数为零,因为表达式(*) 及(**) 取消。

45
何人来此 在职认证  发表于 2022-4-24 18:01:03
要看到这一点,请注意,根据不可知预期定律(*) 对应于-E“E”I{D=D}pd0(X)·E“S·[u(D,1,X)- u(d,1,X)]π(d,X)D=D,X#X##=-E“E”I{D=D}pd0(X)·=π(D,X)z}{E[S | D=D,X]·[u(D,1,X)- u(d,1,X)]π(d,X)X##=-E“=pd0(X)z}{E[I{D=D}|X]pd0(X)·[u(D,1,X)- u(d,1,X)#=-E[u(d,1,X)- u(d,1,X)],因此,Eψd(W,η,ψd)η - η= 0证明分数函数是正交的。假设3.2:干扰参数估计的得分规律性和质量假设3.2(a)该假设直接源自集合TN的构造和规律性条件(假设10)。假设3.2(b)mN的界限:考虑以下不等式ku(D,S,X)kq=(E[|u(D,S,X)|q])=除息的∈{0,1,…,Q},s∈{0,1}E[|u(d,s,X)|qPr(d=d,s=s | X)]Q≥ 2/q除息的∈{0,1,…,Q},s∈{0,1}E[|u(d,s,X)|q]Q≥ 2/q麦克斯∈{0,1,…,Q},s∈{0,1}E[|u(d,s,X)|q]q=2/q麦克斯∈{0,1,…,Q},s∈{0,1}ku(d,s,X)kq,其中第一个等式来自定义,第二个等式来自全概率定律,第一个不等式来自Pr(D=D,S=1 | X)=pd0(X)·π(D,X)≥ Pr(D=D,S=0 | X)=pd0(X)·(1)-π(d,X))≥ .

46
大多数88 在职认证  发表于 2022-4-24 18:01:09
此外,通过Jensen不等式ku(D,s,X)kq≤ kY kq,因此ku(d,1,X)kq≤ C/2/qby条件(A.8)。对于任何η,使用类似的步骤∈ TN:ku(d,1,X)- u(d,1,X)kq≤ C/2/qku(D,S,X)- u(D,S,X)kq≤C.ConsiderEhψd(W,η,ψd0)i=E“i{d=d}·Spd(X)·π(d,X)·Y{z}=i+1.-I{D=D}·Spd(X)·π(D,X)u(d,1,X)|{z}=I-ψd0#和thuskψd(W,η,ψd0)kq≤ kIkq+kIkq+kψd0kq≤kY kq+1- ku(d,1,X)kq+|ψd0|≤ C+2/q·1- +,因为三角不等式和以下不等式组成立:ku(d,1,X)kq≤ ku(d,1,X)- u(d,1,X)kq+ku(d,1,X)kq≤ 2C/2/q(A.3)|ψd |=|E[u(d,1,X)]|≤ Eh |u(d,1,X)| i=ku(d,1,X)kP,1≤ ku(d,1,X)k≤ kY k/2/2q>2z}|{≤ kY kq/ ≤ C/.这给出了切尔诺朱科夫、切特韦里科夫、德米雷尔、杜弗罗、汉森、纽维和罗宾斯(2018)的mnin假设3.2(b)的上限。开往mn:注意E[|ψad(W,η)|q]1/q=1,这给出了假设3.2(b)中的上限。假设3.2(c)对rn有界:对于任何η=(pd,π,ν),我们有Eψad(W,η)- ψad0(W,η)= |1.- 1| = 0 ≤ δN,因此我们得到了假设3.2(c)中Rn的界。在下文中,为了简洁起见,我们省略了参数,并使用pd=pd(X)、π=π(d,X)、u=u(d,1,X)以及类似的pd0、π、u。rn的界:kψd(W,η,ψd0)- ψd(W,η,ψd0)k≤I{D=D}·S·Y·pdπ-pd0π(A.4)+I{D=D}·S·updπ-upd0π+ ku- uk≤Y·pdπ-pd0π+updπ-upd0π+ ku- uk≤Cδn1 ++ δn+ C+C+δn≤ δnas与C一样长在δ的定义中,它非常大。这给出了假设3.2(c)中Rn的界。

47
kedemingshi 在职认证  发表于 2022-4-24 18:01:17
这里我们利用了ku- uk=ku(d,1,X)- u(d,1,X)k≤ δn/, 和kπ- πk=kπ(d,X)- π(d,X)k≤δn/ 使用假设3.1(b)中的类似步骤。(A.10)中的最后一个不平等性之所以成立,是因为我们在第一个学期中Y·pdπ-pd0π≤ Cpdπ-pd0π≤Ckpd0π- pdπk=Ckpd0π- pdπ+pd0π- pd0πk≤Ckpd0(π)- π) k+kπ(pd0- pd)k≤Ckπ- πk+kpd0- pdk≤Cδn1 +,其中,假设4(a)中的第一个不等式来自第二个不等式。(A.10)中的第二项以updπ-upd0π≤kpd0πu- pdπuk=kpd0πu- pdπu+pd0πu- pd0πuk≤kpd0π(u)- u)k+ku(pd0π)- pdπ)k≤ku- uk+C kpd0π- pdπk≤δn+ C kpd0π- pdπk≤ δn1+C+C,其中第三个不等式由E[Y | D=D,S=1,X]得出≥ (E[Y | D=D,S=1,X])=u(D,1,X)由条件詹森不等式确定,因此ku(D,1,X)k∞≤ C.λn的界:现在考虑f(r):=E[ψd(W;ψd0,η+r(η)- η) [参考译文]对于任何人来说∈ (0, 1) :f(r)r=E“2·I{D=D}·S·(Y- u- r(u)- u))(pd- pd0+r(pd- pd0(π+r(π)- π) )#(A.5)+E“2·I{D=D}S·(Y- u- r(u)- u))(π - π) (pd0+r(pd- pd0(π+r(π)- π) )#+E“2·I{D=D}·S·(Y)- u- r(u)- u))(pd- pd0)(π- π) (pd0+r(pd- pd0(π+r(π)- π) )#+E“2·I{D=D}·S·(u- u)(pd)- pd0)(π+r(π)- π) )(pd0+r(pd- pd0(π+r(π)- π) )#+E“2·I{D=D}·S·(u- u)(pd0+r(pd- pd0))(π- π) (pd0+r(pd- pd0(π+r(π)- π) 注意,因为- u(d,1,X)| d=d,S=1,X]=0,|pd- pd0|≤ 2, |π - π| ≤ 2kukq≤ kY kq/1/q≤ C/2/qku- uk×kpd- pd0k≤ δnn-1/2/,ku- uk×kπ- πk≤ δnn-1/2/,对于常数C,我们可以得到这只取决于C和f(r)R≤ Cδnn-1/2≤ δnn-1/2这给出了切尔诺朱科夫、切特韦里科夫、德米雷尔、杜弗罗、汉森、纽伊和罗宾斯(2018)假设3.2(c)的上界,只要c≥ C.

48
nandehutu2022 在职认证  发表于 2022-4-24 18:01:24
我们使用了以下不等式ku- uk=ku(d,1,X)- u(d,1,X)k≤ ku(D,S,X)- u(D,S,X)k/kπ- πk=kπ(d,X)- π(d,X)k≤ kπ(D,X)- π(D,X)k/,这些可以用假设3.1(b)中类似的步骤来表示。为了证实这一点f(r)R≤ Cδnn-1/2成立,请注意,通过三角不等式,可以分别限制(A.11)中十项的绝对值。我们在第一个和最后一个术语中对此进行了说明。第一学期:E“2·I{D=D}·S·(Y- u- r(u)- u))(pd- pd0+r(pd- pd0(π+r(π)- π))#≤E“I{D=D}·S·(Y- u- r(u)- u))(pd- pd0)#≤E“I{D=D}·S·(Y- u)#+E“r(u)- u)(pd)- pd0)#≤2 · 2E“1·(u- u)(pd)- pd0)#≤δnN-1/2.对于第二个不等式,我们使用了≥ pd0+r(pd- pd0)=(1- r) pd0+rpd≥ (1 - r) + R = 对于π和第三个Holder不等式也是如此。第二项和第三项的界限如下。第四学期,我们有E“2·I{D=D}·S·(u- u)(pd)- pd0)(π+r(π)- π) )(pd0+r(pd- pd0(π+r(π)- π))#≤E“I{D=D}·S·(u- u)(pd)- pd0)#≤δnN-1/2此外,我们还利用了条件(A.8)。

49
kedemingshi 在职认证  发表于 2022-4-24 18:01:31
最后一项的边界类似。假设3.2(d)Eh(ψd(W,η,ψd0))i=E“i{d=d}·S·[Y- u]pd0·π|{z}=I+u- ψd0 |{z}=I!#=E[I+I]≥ E[I]=E“I{D=D}·S·[Y- u]pd0·π#≥ E“[Y- u]pd0·π#≥c(1)- )> 因为Pr(D=D,S=1 | X)=pd0(X)·π(D,X)≥ , pd0(X)≤ 1.-  π(d,X)≤ 1.- .第二个等式来自ehi·Ii=E“E[·X]=0z}{I{D=D}·S·[Y- u(d,1,X)]pd0(X)·π(d,X)·μ(d,1,X)- ψd0]#。A.2定理2的证明将干扰参数定义为函数向量η=(π(D,X,Z),pd(X,π),u(D,S,X,π)),其中∏=π(D,X,Z)=Pr(S=1 | D,X,Z),pd(X,π)=Pr(D=D | X,π(D,X,Z)),和u(D,S,X,X,Z)]=E[Y | D,S,X,Z])。日益缩小的社区*nof滋扰参数向量η=(π,pd,u)的定义与定理1证明中的Tnfrom(A.8)类似。反事实ψS=1d0=E[Y(d)|S=1]的得分函数由φd,S=1(W,η,ψS=1d0)=I{d=d}·[Y]给出- u(d,1,X,π)]pd(X)+u(d,1,X,π)- ψS=1d0。

50
kedemingshi 在职认证  发表于 2022-4-24 18:01:38
(A.6)假设3.1:线性分数和内曼正交假设3.1(A)力矩条件:力矩条件Ehφd,S=1(W,η,ψS=1d0)| S=1i=0保持:Ehφd,S=1(W,η,ψS=1d0)S=1i=E“=E[Y-u(d,1,X,π)|d=d,S=1,X,π]=0z}|{E“I{d=d}·[Y]- u(d,1,X,π)]pd0(X,π)S=1,X,π#+u(d,1,X,π)- ψS=1d0S=1#=E[u(d,1,X,π)|S=1]- ψS=1d0=0,其中第一个等式遵循迭代期望定律。假设3.1(b)线性:分数φd,S=1(W,η,ψS=1d0)在ψS=1d0:φd,S=1(W,η,ψS=1d0)=φad,S=1(W,η)·ψS=1d0+φbd,S=1(W,η)中是线性的,φad,S=1(W,η)=-1和φbd,S=1(W,η)=I{D=D}·[Y- u(d,1,X,π)]pd0(X,π)+u(d,1,X,π)。假设3.1(c)连续性:映射η7的二阶Gateaux导数的表达式→ (A.6)中给出的E[φd,S=1(W,η,ψS=1d0)]是连续的。假设3.1(d)内曼正交性:对于任何η∈ Tn,η方向上的Gateaux导数- η=(π(D,X,Z)-π(D,X,Z),pd(X,π)- pd0(X,π),u(D,S,X,π)- u(D,S,X,π))由下式给出:Eφd,S=1(W,η,ψS=1d)|S=1η - η=- E“I{D=D}·[u(D,1,X,π(D,X,Z))- u(d,1,X,π(d,X,Z))]pd0(X,π(d,X,Z))S=1#(*)+ E[u(d,1,X,π(d,X,Z))- u(d,1,X,π(d,X,Z))|S=1](**)- E“E[·| S=1,X,π]=E[Y-u(d,1,X,π)|d=d,S=1,X,π]=0z}|{I{d=d}·[Y]- u(d,1,X,π(d,X,Z))]pd0(X,π(d,X,Z))·pd(X,π(d,X,Z))- pd0(X,π(d,X,Z))pd0(X,π(d,X,Z))S=1#- E“I{D=D}E[u(d,1,X,π(d,X,Z))]·[π(d,X,Z)- π(d,X,Z)]pd0(X,π(d,X,Z))S=1#(* * *)- E“E[·| S=1,X,π]=E[Y-u(d,1,X,π)|d=d,S=1,X,π]=0z}|{I{d=d}·[Y]- u(d,1,X,π(d,X,Z))]pd0(X,π(d,X,Z))·E[pd0(X,π(d,X,Z))]·[π(d,X,Z)- π(d,X,Z)]pd0(X,π(d,X,Z))S=1#+E[u(d,1,X,π(d,X,Z))]·[π(d,X,Z)- π(d,X,Z)| S=1](* * **)= 0.Gateaux导数为零,因为表达式(*) 及(**) 以及(* * *) 及(* * **), 分别取消。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 03:14