楼主: 何人来此
2513 50

[经济学] 样本选择模型的双机器学习 [推广有奖]

31
kedemingshi 在职认证  发表于 2022-4-24 17:59:27
数据集包含关于项目参与者的非常详细的治疗前信息,例如:期望值、申请JC的动机、年龄、性别、治疗分配时的儿童数量、职业、家庭收入、小时工资、教育水平、婚姻状况、个人是否曾上过学、JC项目、,或其他学术或职业培训、健康状况、过去的工作、犯罪类型、参加培训的家庭支持,以及关于母亲和父亲的信息(例如教育和就业)。此外,在JC任务完成后的几次后续访谈中,对劳动力市场状况、就业、收入和教育等一系列变量进行了重新评估。Schochet、Burghardt和Glazerman(2001)以及Schochet、Burghardt和McConnell(2008)评估了随机项目分配对广泛劳动力市场结果的影响,从长远来看,对教育、就业和收入产生了积极影响。一些研究侧重于JC更具体的项目方面,例如,培训时间或培训干预的离散序列对就业和收入等劳动力市场结果的影响,以及JC的因果机制,即对劳动力市场结果和健康的直接和间接影响(通过特定中介变量操作)。例如,Flores、Flores Lagunes、Gonzales和Neuman(2012)承认存在几种类型的教学,加上课程的自定进度性质,在参与者接受职业或学术培训的周数上造成了选择性的异质性。

32
大多数88 在职认证  发表于 2022-4-24 17:59:33
考虑到连续分配的治疗剂量,同时控制基线协变量,他们发现培训周数对收入有积极影响,但是,随着已完成周数的增加,边际回报降低。Flores和Flores Lagunes(2009)以及Huber(2014a)分别研究了将工作经验或就业作为中介因素时JC背后的因果机制,并在基于可观察假设进行选择时,分别发现积极的直接影响学习和总体健康。Flores和Flores Lagunes(2010)提出了一种部分识别策略,避免了后一种假设,他们在将GED、高中学位或职业学位的成绩作为中介时,根据该策略估计JC因果机制的界限。在他们最强大的一组边界假设下,结果表明,即使不考虑通过获得学位的间接机制,也会对劳动力市场结果产生积极影响。Fr–olich和Huber(2017)基于工具变量方法对因果机制进行了分析,并通过工作小时数的增加发现了JC培训对收入的积极间接影响。此外,还考虑了专门处理截断结果(如工资)的估算方法,这些截断结果仅针对特定的亚群体(如就业人群)进行观察和定义。例如,Frumento、Meali、PaCII、Rubin(2012)和张、Rubin和Meali(2009)考虑了Frangakis和Rubin(2002)的主阶层方法,以评估JC对特殊群体中的就业和工资的影响,例如那些与雇佣参与无关的雇佣关系,而不是全人口。

33
何人来此 在职认证  发表于 2022-4-24 17:59:39
Frumento、Mealli、Pacini和Rubin(2012)同时解决了与培训参与与JC任务不一致相关的几个识别问题,以及基于有限混合模型的基于可能性分析的调查未回应或未就业导致的工资结果缺失。他们发现了对工资的积极影响,并有证据表明,理想情况下,该计划应该根据个人特征针对不同的个人亚群体进行不同的设计。Lee(2009)考虑了一种局部识别方法,用于界定JC分配对找到工作的人的工资的影响,而不考虑分配。该方法没有调用MAR或IV假设进行样本选择,而仅仅依赖于JC分配中就业的单调性(这样,随机分配不会降低就业状态),代价是放弃点识别。Semenova(2020)提出了一种DML方法,通过以数据驱动的方式控制协变量X来收紧界限。基于边界的结果通常指向JC分配对工资的积极影响(治疗意图)。最后,Bodory、胡贝尔和LA(2020)考虑基于DML的动态治疗评估,施加序贯条件独立假设来分析JC分配后的第一和第二年的离散序列训练。控制基线特征和第一个治疗期(即。

34
可人4 在职认证  发表于 2022-4-24 17:59:47
一年后,他们发现一系列职业培训对就业产生了积极影响。对于我们的实证分析,我们同样与FR·奥利奇和胡贝尔(2017)考虑女性应用JC,并旨在估计在艺龙网(D)年中的学术或职业培训的每小时工资(Y)在短期内的测量在第一年或更长的时间内,测量4年后,随机分配给JC。小时工资仅以各自产出期内的就业情况为条件。尽管分配是随机的,但实际参与培训活动可能是选择性的,并且与个人因素有关,类似于选择就业。例如,正如Echner和Wunsch(2013年)以及Biewen、Fitzenberger、Osikomin和Paul(2014年)所讨论的,以前的劳动力市场历史和社会经济特征可能是影响培训干预的重要混杂因素,这促使我们的DML方法以数据驱动的方式解释丰富的协变量集。为了评估短期影响,我们要么按照第2节中讨论的假设,使用基于定理1的DML方法来控制我们所有355个基线协变量(X),要么根据定理3施加第3节中的IV假设来估计ATE,将家庭atJC分配中的幼儿数量作为就业工具(Z)。

35
何人来此 在职认证  发表于 2022-4-24 17:59:54
尽管许多在劳动经济学中的研究认为儿童是就业的工具,但是小规模的儿童的存在与个人特征相关,也涉及工资,因此胡的有效性-我们的目的是通过在X中包含丰富的个体预处理特征来缓解,这可能与生育率和工资相关。为了评估长期影响,我们援引第4节的顺序条件独立假设,根据定理4应用DML。为此,我们在JC分配后的第二年和第三年分别控制了619个和156个治疗后协变量(M),其中包括第一次治疗后和第二次治疗前劳动力市场参与的详细信息。附录C给出了X和M中所选变量的描述性统计数据。我们还参考了Bodory、Huber和La offers(2020)对我们的应用中使用的治疗前和治疗后协变量的更详细描述,并注意到所有数值变量均已标准化,平均值等于0,标准偏差等于0.5,以便于基于机器学习的干扰参数估计。Forestimation,我们应用causalweight Package for R的treatselDML和dyntreatDML命令,使用3倍交叉拟合和随机林(带有SuperLearnerpackage的默认选项)作为机器学习器。

36
kedemingshi 在职认证  发表于 2022-4-24 18:00:00
后者是一种非参数方法,允许结果、治疗和选择与协变量之间存在非线性关联。表3:从JC 1698对照组(无培训)中随机抽取的治疗观察(无培训)200学术培训830职业培训843表3报告了在数据中记录项目分配后的第一年,随机抽取到JC的女性参与其职业(843)或学术培训(830)的总人数。在我们的分析中,200名女性没有参加任何JC培训活动,并作为对照组。此外,1698人从JC随机抽取。表4:ATE estimatesD=1 D=0 ATE标准误差p值定理1(MAR)学术无培训-0.683 1.073 0.524职业无培训0.611 0.629 0.331定理3(IV)学术无培训-0.631 1.052 0.549职业无培训0.586 0.645 0.364理论4(顺序)学术无培训0.149 0.199 0.454职业无培训0.567 0.208 0.007表4报告了学术和非培训的ATE估计值基于我们各种DML方法的职业培训。上面板提供了第一年最后一周(假设为3月)对小时工资的短期影响。学术培训的分数估计为负值(-0.683美元),而职业培训的影响是积极的(0.611美元),但在任何常规水平上,这两种影响都不具有统计学意义。当考虑到中间小组中显示的基于IV的估计时,结果非常相似,分别对学术和职业培训产生负面和正面影响,这在统计上也不显著。下面板根据连续条件独立性假设,提供了派遣后4年对小时工资的长期影响。

37
何人来此 在职认证  发表于 2022-4-24 18:00:06
虽然现在两个ATE估计值都是正值,但只有职业培训的影响(每小时增加0.567美元)在统计学上非常显著。因此,我们的研究结果表明,基于JC的教育可能会促进人力资本积累,在几年后增加小时工资,特别是通过职业培训,但没有明确的证据表明短期影响。8结论在本文中,我们讨论了基于双机器学习的样本选择或结果消耗情况下的平均治疗效果评估。在确定假设方面,我们在治疗分配中采用了一种基于观察值的选择假设,它与基于观察值的选择或关于结果损耗/样本选择过程的工具变量假设相结合。我们还考虑了对可观测数据的顺序选择假设,允许动态混杂,这样,共同影响结果的协变量和样本选择可能会受到治疗的影响,从而避免了对治疗前协变量的排他性影响。我们提出了双稳健评分函数,并正式展示了内曼正交性的满意度,这意味着基于这些评分函数的估计器在基于机器学习的结果、治疗或样本选择模型估计中对中度(局部)正则化偏差是稳健的。此外,我们还证明了我们的双机器学习方法在特定正则性条件下用于平均治疗效果估计的根n一致性和渐近正态性。我们还为美国就业服务团的数据提供了一个实证说明,其中我们评估了培训对项目分配后一年和四年的小时工资的影响,并发现了一些长期积极影响的统计证据。

38
nandehutu2022 在职认证  发表于 2022-4-24 18:00:13
我们的估计程序可在统计软件R.ReferencesAbowd,J.,B.Crepon和F.Kramarz(2001):“具有损耗的矩估计:经济模型的应用”的因果权重包中找到,《美国统计协会杂志》,961223–1230。Ahn,H.和J.Powell(1993):“具有非参数选择机制的删失选择模型的半参数估计”,《计量经济学杂志》,第58期,第3-29页。Angrist,J.,E.Bettinger和M.Kremer(2006):“中学教育券的长期教育后果:来自哥伦比亚行政记录的证据”,《美国经济评论》,96847–862。Bang,H.和J.Robins(2005):“缺失数据和因果关系模型中的双重稳健估计”,生物统计学,61962-972。Barnwell,J.-L.和S.Chaudhuri(2020):“随机数据单调缺失的亚种群和全种群的有效估计”,工作论文,蒙特利尔麦吉尔大学。Belloni,A.,V.Chernozhukov和C.Hansen(2014):“高维对照选择后治疗效果的推断”,《经济研究评论》,81608-650。Biewen,M.,B.Fitzenberger,A.Osikomin和M.Paul(2014):“重新审视公共资助培训的有效性:数据和方法选择的重要性”,《劳动经济学杂志》,第32期,第837-897页,。布伦德尔,R.W.和J.L.鲍威尔(2004):“半参数二元反应模型中的内生性”,《经济研究评论》,71655-679。BooDy,H.和M. Huber(2018):“因果推理在R中的因果包”,福里堡大学SES工作论文493。Bodory,H.,M.Huber和L.Laff’ers(2020):“通过双机器学习评估(加权)动态治疗效果”,arXiv预印本arXiv:2012.00370。Carroll,R.,D.Ruppert和L.Stefanski(1995):非线性模型中的测量误差。

39
mingdashike22 在职认证  发表于 2022-4-24 18:00:19
查普曼和霍尔,伦敦。Chernozhukov,V.,D.Chetverikov,M.Demirer,E.Duflo,C.Hansen,W.Newey和J.Robins(2018):“治疗和结构参数的双/Debied机器学习”,经济计量学杂志,21,C1–C68。Das,M.,W.K.Newey和F.Vella(2003):“样本选择模型的非参数估计”,《经济研究评论》,70,33–58。d\'Haultfoeuille,X.(2010):“处理内生选择的新工具方法”,《计量经济学杂志》,154,1-15。法瑞尔,M.H.,T. Liang和S. Misra(2018):“用于估计和推理的深神经网络:应用于因果关系和其他半参数预测”,芝加哥大学的工作论文。Fitzgerald,J.,P.Gottschalk和R.Moffitt(1998):“面板数据中样本消耗的分析:密歇根州收入动态面板研究”,《人力资源杂志》,33251–299。Flores,C.A.和A.Flores Lagunes(2009):“在不确定情况下对治疗的因果机制和净效果的识别和评估”,IZA DP第4237号。标准杆数标准杆数弗洛里斯、C. A.和A. Flores Lagunes(2010):“因果网的非参数部分识别和机构平均处理”,Mimeo,佛罗里达大学。Flores,C.A.,A.Flores Lagunes,A.Gonzales和T.Neuman(2012):“评估培训项目中接受教育时间长短的影响:就业团队的案例”,《经济学与统计学评论》,94153–171。Frangakis,C.和D.Rubin(2002):“因果推断中的主要分层”,生物统计学,第58、21–29页。弗罗里奇、M.和M.胡伯(2017):“直接和间接治疗效果:因果链和中介分析,工具变量”,皇家统计学会期刊:系列(B),791645–1666。弗鲁门托,P.,F.米利,B.帕西尼和D.B。

40
mingdashike22 在职认证  发表于 2022-4-24 18:00:28
鲁宾(2012):“评估培训对不遵守规定、未就业和遗漏数据情况下工资的影响”,《美国统计协会杂志》,107450–466。Gronau,R.(1974):“工资比较——选择性偏见”,《政治经济学杂志》,821119-1143。Hausman,J.和D.Wise(1979):“实验和面板数据中的损耗偏差:加里收入维持实验”,计量经济学,47(2),455–473。Heckman,J.(1976):“截断、样本选择和有限因变量统计模型的共同结构,以及此类模型的简单估计,”经济和社会测量年鉴,5475–492。Heckman,J.(1979):“样本选择偏差是一种规格误差”,计量经济学,47153–161。Huber,M.(2012):“在替代磨蚀形式下,社会实验中平均治疗效果的确定”,《教育与行为统计杂志》,37443-474。Huber,M.(2014a):“基于逆概率加权确定(主要)因果机制”,《应用计量经济学杂志》,29920–943。Huber,M.(2014b):“样本选择下的治疗评估”,计量经济学观点,33869-905。Huber,M.和B.Melly(2015):“样本选择模型中条件独立性假设的检验”,《应用计量经济学杂志》,30144–1168。Imai,K.(2009):“具有不可忽略缺失二元结果的随机实验的统计分析:投票实验的应用”,《皇家统计学会期刊》C辑,58,83–104。Imbens,G.W.(2004):“外生条件下平均治疗效果的非参数估计:综述”,《经济学与统计学评论》,86,4-29。Imbens,G.W.和W.K.Newey(2009):“无可加性的三角同时方程模型的识别和估计”,计量经济学,771481–1512。Imbens,G。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 03:09