楼主: 大多数88
1953 77

[量化金融] 样本选择的边际处理效应的锐界 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-6-14 12:50:58
最后,第7节得出结论。2框架我从Rubin(1974)的经典潜在结果框架开始,并将其修改为包含样本选择问题。设Z为工具变量,其支持度由Z给出,X为协变量向量,其支持度由X给出,W:=(X,Z)为组合协变量和工具的向量,其支持度由W:=X×Z给出,Dbe为治疗状态指示器,Y*当患者未接受治疗时,成为潜在的利益结果,并且*当患者接受治疗时,是潜在的利益结果。利息的产出变量(如工资)为Y*:= D·Y*+ (1 - D) ·Y*. 此外,让SandSbe在处理和未处理时的潜在样本选择指标确定:=D·S+(1- D) ·Sas样本选择指标(如就业状态)。定义:=S·Y*作为可观察的结果(例如,劳动收入)。我还确定Y:=S·Y*安迪:=S·Y*作为潜在的可观察结果。注意,继Lee(2009)和Chen&Flores(2015)之后,我的注释隐含了两个排除限制:Z对潜在的利益结果和样本选择指标没有直接影响。在经验应用中,需要注意第二个排除限制。一方面,在随机对照试验中,如果样本选择是由于消耗,并且初始分配对受试者联系研究人员的意愿有影响,这可能是一个强有力的假设。另一方面,在许多劳动力市场应用中,这可能是一个合理的假设,例如职业培训计划的评估。例如,在我的实证部分中,就业团队培训计划(JCTP)的初始随机分配可能不会对未来的就业状况产生影响。我使用广义罗伊模型(Heckman&Vytlacil 1999)对样本选择和治疗选择进行建模。

12
可人4 在职认证  发表于 2022-6-14 12:51:01
设U和V为随机变量,P:W→ R和q:{0,1}×X→ R可能是未知函数。我假设:D:=1{P(W)≥ U} (1)AND:=1{Q(D,X)≥ V}。(2) 正如Vytlacil(2002)所示,方程(1)和(2)等价于假设关于选择到治疗问题(Imbens&Angrist(1994))和样本选择问题(Lee(2009))的单调条件。我强调,这两个单调性假设都可以使用Machado等人(2018)开发的工具进行测试。还请注意,给定方程式(2),S=1{Q(0,X)≥ V}和S=1{Q(1,X)≥ V}。随机变量U和V在X上联合连续分布,密度为fU,V | X:R×X→ R和累积分布函数FU,V | X:R×X→ R、 如文献所示,方程(1)和(2)可以在d=1时重写FU | X(P(W)| X)≥ FU | X(U | X)= 1nP(W)≥UoS=1FV | X(Q(D,X)| X)≥ FV | X(V | X)= 1nQ(D,X)≥~VowhereP(W):=FU | X(P(W)| X),~U:=FU | X(U | X),~Q(D,X):=FV | X(Q(D,X)| X,~V:=FV | X(V | X)。因此,以X为条件的▄U和▄V的边际分布遵循标准均匀分布。由于这仅仅是一个规范化,我在整篇文章中省略了tilde和mantain,即(P(w),Q(d,x))的规范化∈ [0,1]对于任何(x,z,d)∈ W×{0,1}和以X为条件的U和V的边际分布遵循标准均匀分布,即使它们的联合分布允许这两个变量之间存在任何依赖关系。

13
可人4 在职认证  发表于 2022-6-14 12:51:04
作为这种归一化的结果,P(w)表示倾向得分,等于P【D=1 | w=w】,而Q(D,x)等于toP【Sd=1 | x=x】。此外,我假设:假设1工具Z独立于给定协变量x的所有潜在变量,即Z⊥⊥ (U、V、Y*, Y*) |十、假设2给定X的P(W)的分布是非退化的。假设3利益相关者潜在结果的第一和第二人口矩,即e[| Y*d |]<+∞ 和Eh(Y*d) i<+∞ 对于任何d∈ {0, 1}.假设4两个治疗组均存在任何X值,即0<P[D=1 | X]<1。假设5协变量X对反事实操作是不变的,即X=X=X,其中X和X分别是在患者未接受治疗或治疗时观察到的X的反事实值。假设6潜在结果Y*和Y*具有相同的支持,即Y*:= Y*=Y*, 其中Y* R是Y的支持*和Y* R是Y的支持*.假设7定义*:= inf{y∈ Y*} ∈ R∪ {-∞} 和y*:= 辅助{y∈ Y*} ∈ R∪ {∞}.我假设y*和y*都是已知的,这是1。y*> -∞, y*= ∞ 和Y*是一个间隔,或2。y*= -∞, y*< ∞ 和Y*是一个间隔,或3。y*> -∞, y*< ∞ 和(a)Y*是间隔或(b)y*∈ Y*和y*∈ Y*.假设7相当普遍。案例1包括连续随机变量,其支持度为凸且下有界(例如工资),而案例3。a包括具有有界凸支撑的连续变量(例如,测试分数)。案例3。b不仅包括二元变量,还包括任何支持度有限的离散变量(如教育年限)。它还包括混合随机变量,其支持度不是一个区间,而是达到其最大值和最小值。案例2是为了理论上的补充。

14
kedemingshi 在职认证  发表于 2022-6-14 12:51:07
此外,命题13表明,假设7对于M T EOOof兴趣边界的存在是部分必要的,在这个意义上,如果y*= -∞ 和y*= +∞, 那么,在没有任何额外假设的情况下,就不可能将边缘治疗对始终观察到的亚群体的利益结果的影响联系起来。假设8治疗对所有个体的样本选择指标都有积极影响,即对于任何x,Q(1,x)>Q(0,x)>0∈ 十、假设8超越了等式(2)隐含的单调性条件,假设处理对样本选择指标的影响方向已知且为正,即Q(1,x)≥ 任意x的Q(0,x)∈ 十、从这个意义上讲,这是文献中的一个标准假设。最重要的是,使用Machado等人(2018)开发的工具,这也是一个可测试的假设,因为在单调样本选择(方程式(2))下,选择指标上ATE符号的识别提供了对假设8的测试。然而,假设8比文献中通常采用的假设略强,因为它另外对任何x施加Q(0,x)>0和Q(1,x)>Q(0,x∈ 十、第一个不平等意味着有一个子群体总是被观察到,这使我能够正确定义我的目标参数(边际治疗对总是被观察到的群体内的利益结果的影响,M T EOO),第二个不平等意味着有一个子群体只有在治疗时才被观察到,通过消除Lee(2009)和Chen&Flores(2015)讨论的M T EOOA点识别的琐碎案例,使问题在理论上具有吸引力,并以与S≥ S、 而Manski(1997)和Manski&Pepper(2000)称之为“单调治疗反应”假设。提案10。

15
可人4 在职认证  发表于 2022-6-14 12:51:10
最后,我强调,如果我对任何x施加Q(0,x)>Q(1,x)>0,那么我的所有结果都可以通过一些简单的更改来陈述和导出∈ X代替了附录C中的假设8。我还在附录D中讨论了样本选择问题中单调性的不可知方法(方程式(2)),并在附录E中表明,非单调样本选择得出的边界是无信息的(即等于y*- y*, y*- y*) 在温和的规则性条件下。在我的实证应用中,假设8规定,JCTP对所有个人的就业都有积极影响,考虑到本培训计划提供的目标和服务,这是合理的。正如Chen&Flores(2015)所讨论的,it的两个潜在威胁——“锁定”效应(van Ours(2004))和受治疗个体的保留工资的增加从长远来看可能变得不那么相关,这证明了我在随机分组208周后将重点放在小时工资上的合理性。最重要的是,这一假设通过Machado等人(2018)开发的方法进行了正式测试,我在1%的显著性水平上拒绝了假设8在非西班牙裔群体中无效的无效假设。最后,在部分识别环境中,额外的假设可能具有很大的识别能力。在通过样本选择确定治疗效果的特定情况下,通常使用均值或随机优势假设来收紧兴趣参数的界限(Imai(2008),Blanco et al.(2013a),Huber&Mellace(2015)和Huber et al.(2017)),并基于一些人口亚群体比其他群体具有更有利的基本特征这一直观论点对其进行了论证。

16
nandehutu2022 在职认证  发表于 2022-6-14 12:51:13
特别是,我讨论了以下平均优势假设的识别能力:假设9:只有在治疗亚群时,在始终观察到的亚群内治疗的潜在结果大于或等于观察到的相同参数:E[Y*|X=X,U=U,S=1,S=1]≥ E【Y】*|X=X,U=U,S=0,S=1]在附录F中,当上述不等式在另一个方向上成立时,我推导出相关MTE的边界。对于任何x∈ X和u∈ [0, 1].不幸的是,这种假设在经验上是不稳定的,这意味着它的使用必须基于定性或理论上的论点,针对每个应用程序进行调整。特别是,在我的实证应用中,假设9规定,对总就业人口进行治疗时,工资的边际治疗反应函数大于仅对接受治疗的人口进行治疗时的相同目标。直觉上,这一假设假定,具有更好潜在就业结果的群体平均也具有更好的潜在工资,即存在积极的就业选择。3兴趣结果的MTEOON界限目标参数,即始终观察到的子群体兴趣结果的MTE(M T EOO),由下式给出OOY公司*(x,u):=E[Y*- Y*|X=X,U=U,S=1,S=1]=E[Y*|X=X,U=U,S=1,S=1]- E【Y】*|X=X,U=U,S=1,S=1](3)对于任何U∈ [0,1]和任意x∈ 是一个自然参数。在劳动力市场应用中,样本选择是因为只有在雇佣代理人时才观察工资,这是对总是被雇佣的子群体工资的影响。在因患者死亡而选择样本的医疗应用中,无论治疗状态如何,都会对存活的亚群体的健康质量产生影响。

17
nandehutu2022 在职认证  发表于 2022-6-14 12:51:16
在教育文献中,样本选择是因为学生辍学,这是对不辍学的亚群体的测试分数的影响,无论他们的治疗状况如何。在所有这些病例中,目标参数捕捉到治疗效果的强化边缘。其他可能令人感兴趣的参数是研究人员对治疗效果的广泛范围感兴趣时,研究人员对可观察结果的MTE(e[Y])- Y | X=X,U=U]),并通过选择指示器上的MTE(E[S- S | X=X,U=U]),他或她可以应用Heckman et al.(2006)、Brinch et al.(2017)和Mogstad et al.(2018)所述的识别策略。从未被观察到的亚群(E[Y*- Y*|X=X,U=U,S=0,S=0),M T ENN),在未治疗的情况下,仅在治疗时观察到的亚群内的MTR功能*|X=X,U=U,S=0,S=1),MT RNO)和治疗中的MTR功能,以获得仅在治疗时才接受治疗的亚群中感兴趣的结果(E[Y*|X=X,U=U,S=0,S=1),MT RNO)。虽然最后一个参数可以部分识别(附录B),但前两个参数不可能以信息性的方式进行点识别或绑定,因为感兴趣的结果(Y*或Y*)从未观察到调节亚群。因此,不可能以一种信息性的方式点识别或界定整个种群的边际处理效应(E[Y*- Y*|X=X,U=U],MT E)。还请注意,仅在未治疗时观察到的亚群(S=1和S=0)不存在于假设8中。

18
nandehutu2022 在职认证  发表于 2022-6-14 12:51:18
此外,观察上述所有参数中的调节亚群是由治疗后的结果决定的,因此与被称为主要分层的统计文献有关(Frangakis&Rubin(2002))。我现在关注目标参数OOY公司*(x,u)由等式(3)给出。虽然第3.1小节仅使用单调性假设(假设1-8)推导出了MT EOOof利息的界限(方程式(3)),但第3.2小节通过额外施加平均优势假设9来收紧这些界限。最后,第3.3小节讨论了此类界限的经验相关性。3.1仅具有单调性假设的部分识别在这里,我的目标是推导OOY公司*(x,u)在假设1-8下。注意,等式(3)中的第二个右项可以写成[Y*|X=X,U=U,S=1,S=1]=我的(X,U)mS(X,U),(4)Zhang等人(2008年)更深入地讨论了这一识别问题。此外,在一些应用中(例如,分析医疗对健康质量衡量的影响,其中选择是根据患者是否活着),潜在结果是*当d的Sd=0时,甚至没有正确定义d∈ {0, 1}.附录A.1包含该索赔的证明。其中,我将mY(x,u):=E[Y | x=x,u=u]和mS(x,u):=E[S | x=x,u=u]分别定义为与反事实变量Yand和S相关的TR函数。

19
kedemingshi 在职认证  发表于 2022-6-14 12:51:21
在本节中,我假设等式(4)右侧的所有术语都是点识别的,将其识别的讨论推迟到第4节和第5节。方程(3)中的第一个右项可以写成*|X=X,U=U,S=1,S=1]=我的(X,U)- NOY(x,u)·S(x,u)mS(x,u),(5),其中mY(x,u):=E[Y | x=x,u=u]是与反事实变量Y关联的MTR函数,NOY(x,u):=E[Y- Y | X=X,U=U,S=0,S=1]是仅在治疗时观察到的亚群的可观察结果Y的mT,S(x,u):=E[S- S | X=X,U=U]=毫秒(X,U)- mS(x,u)是选择指示器上的MTE,mS(x,u):=E[S | x=x,u=u]是与反事实变量S关联的MTR函数。在本节中,我还假设mY(x,u)和S(x,u)是点识别,将关于其识别的讨论推迟到第4节和第5节。虽然E[Y]的点识别*|X=X,U=U,S=1,S=1]由于该术语,不可能方程(5)中的NOY(x,u),我可以找到它的可识别边界。命题10假设mY(x,u)、mY(x,u)、mS(x,u)和S(x,u)是在假设1-6、7.1和8下确定的点,E[Y*|X=X,U=U,S=1,S=1]必须满足yy*≤ E【Y】*|X=X,U=U,S=1,S=1]≤mY(x,u)- y*· S(x,u)mS(x,u)。(6) 在假设1-6、7.2和8下,E【Y】*|X=X,U=U,S=1,S=1]必须满足y(X,U)- y*· S(x,u)mS(x,u)≤ E【Y】*|X=X,U=U,S=1,S=1]≤ y*. (7) 根据假设1-6、7.3(子案例(a)或(b))和8,E【Y】*|X=X,U=U,S=1,S=1]附录A.2包含该索赔的证明。附录A.3包含了这一主张的证明。必须满足my(x,u)- y*· S(x,u)mS(x,u)≤ E【Y】*|X=X,U=U,S=1,S=1]≤mY(x,u)- y*· S(x,u)mS(x,u)。

20
何人来此 在职认证  发表于 2022-6-14 12:51:24
(8) 请注意,即使支撑仅在一个方向上有界(假设7.1和7.2),也可以导出E[Y]的下界和上界*|X=X,U=U,S=1,S=1]。此时,有必要了解这些边界宽度的决定因素。首先,如果根本没有样本选择问题(P[S=1,S=1 | X=X,U=U]=1,即始终观察到的组是整个群体),那么mS(X,U)=1,S(x,u)=0,表示方程式(5)中的点识别。其次,如果不存在关于治疗状态的不同样本选择问题(P[S=0,S=1 | X=X,U=U]=0,即仅当治疗亚群质量为零时观察到),则S(x,u)=0,再次表示方程式(5)中的点识别。这两种情况在理论上都是无趣的,并被假设8排除在外。最后,结合方程式(3)和(4)以及命题10,我可以部分识别目标参数OOY公司*(x,u):推论11假设mY(x,u),mY(x,u),mS(x,u)和S(x,u)为点识别。在假设1-6、7.1和8下OOY公司*(x,u)由下式给出OOY公司*(x,u)≥ y*-我的(x,u)毫秒(x,u)=:OOY公司*(x,u)(9)和OOY公司*(x,u)≤mY(x,u)- y*· S(x,u)mS(x,u)-我的(x,u)毫秒(x,u)=:OOY公司*(x,u)。(10) 在假设1-6、7.2和8下OOY公司*(x,u)由OOY公司*(x,u)≥mY(x,u)- y*· S(x,u)mS(x,u)-我的(x,u)毫秒(x,u)=:OOY公司*(x,u)(11)和OOY公司*(x,u)≤ y*-我的(x,u)毫秒(x,u)=:OOY公司*(x,u)。(12) 在假设1-6、7.3(子案例(a)或(b))和8下OOY公司*(x,u)由给出OOY公司*(x,u)≥ 最大值mY(x,u)- y*· S(x,u)mS(x,u),y*-我的(x,u)毫秒(x,u)=:OOY公司*(x,u)(13)和OOY公司*(x,u)≤ 最小值(mY(x,u)- y*· S(x,u)mS(x,u),y*)-我的(x,u)毫秒(x,u)=:OOY公司*(x,u)。(14) 此外,我可以证明:定理12假设函数mY,mY,mSand在每个空气(x,u)处确定的Sare点∈ X×[0,1]。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-16 16:48