刊期:《数量经济技术经济研究》2025年第2期
原标题:因果中介分析的理论进展及其应用
作者简介:
赵西亮,厦门大学宏观经济研究中心、厦门大学经济学院和王亚南经济研究院教授。研究方向劳动经济学和应用微观计量经济学。编著畅销教材《基本有用的计量经济学》,被京东评为“十大构思细腻的大学教材”之一。
主持国家社会科学基金、教育部人文社会科学基金等项目6项。
在《经济研究》《数量经济技术经济研究》《经济学(季刊)》、China Economic Review等期刊发表论文30余篇,担任《经济研究》《管理世界》《数量经济技术经济研究》、China Economic Review等期刊匿名审稿人。
研究背景:
最近二十多年来,因果中介分析方法作为一种重要的机制分析工具取得了重要的发展,它完善了传统的中介分析方法,使机制分析更加可信。该方法已经广泛应用于社会学、流行病学和生物统计学等领域,然而,国内鲜有文献介绍因果中介分析,本文试图将这一重要方法介绍给国内用户。
主要结论:
我们首先简单介绍传统中介分析方法并讨论其局限,传统方法依赖于线性结构模型和三步回归方法。第一步,结果变量对解释变量回归,得到总效应的估计;第二步,中介变量对解释变量回归得到对中介变量影响的估计;第三步,结果变量对解释变量和中介变量回归,得到控制解释变量后中介变量对结果变量影响的估计。第三步估计中解释变量的系数为直接效应,第二步回归系数和第三步中介变量的系数乘积,反映了解释变量通过中介变量对结果的影响程度,是间接效应或中介效应。然而,这种方法假设模型设定是正确的。如果原因变量或中介变量是内生的,则估计结果将会有偏差。另外,传统中介分析方法没有考虑不同干预状态下的中介效应异质性,从而降低了确定因果机制的可信性。
因果中介分析通过提供更灵活、更稳健的因果推断框架来解决这些局限性。本文侧重于两个关键参数:自然间接效应(NIE)和自然直接效应(NDE)。自然间接效应度量当个体维持干预状态不变而中介变量由控制状态转向干预状态时取值的变化对潜在结果的影响。自然直接效应则是维持中介变量取值不变,仅由干预状态的变化所造成的潜在结果的变化。识别这些效应的核心假设是序贯可忽略性(Sequential Ignorability),这个假设要求在控制协变量的情况下,干预分配是近似随机化的,并且在已知干预状态和协变量的情况下,中介变量也是近似随机化的。尽管这一假设很强,但它允许对直接和间接效应进行因果识别。我们还讨论了中介效应的各种估计方法,以及处理违反序贯可忽略性假设时的方法。当干预和/或中介变量内生时,可以利用工具变量法(IV)或双重差分法(DID),解决干预和中介的内生性问题,提高估计的可信性,本文对如何利用工具变量解决中介变量的内生性问题,以及同时解决干预和中介的内生问题进行了详细讨论。
最后,我们利用2018年中国居民收入调查项目(CHIP)城镇居民数据,利用本文介绍的因果中介方法评估了教育通过职业渠道影响收入的程度,发现大学教育可以通过职业渠道显著提升居民收入,职业渠道可以解释大学教育回报的45%左右,而对仅完成高中教育的个体,职业渠道对收入的影响较小,仅11%左右。利用配偶教育、父母职业分别作教育和职业的工具变量处理干预和中介变量的内生性问题后,得到的结果基本一致。
政策启示:
本文表明,因果中介分析可以用于机制分析,了解因果效应产生的渠道以及具体渠道在解释总效应时的解释力的大小。现有经济学实证研究中,机制分析部分往往根据经济学理论或研究者的直观理解进行回归检验,通常是用中介变量对干预变量的回归分析得到,而中介对结果的影响往往不再考察。这种方法只能证明这一渠道可能存在,但并不能说明这一渠道的重要性,也许这一渠道对总效应的解释微乎其微,因而,需要将干预影响中介及中介影响结果的渠道进行完整的分析,估计出中介效应,才能更好的说明中介变量在解释渠道中所起的作用。
赵西亮老师独家‘因果推断’专场课程
当因果推断遇见DDML和DeepSeek
基于设计的计量经济学
2025年5月全面升级
新增了:
1. 高维协变量下的统计推断和因果推断方法
这在大数据时代尤为重要,因为很多时候我们面临的解释变量个数甚至多于样本量
2. 平行趋势假设检验方法及平行趋势假设不满足时的敏感性分析方法
这对于双重差分等研究设计来说,是至关重要的检验环节
3. 因果中介分析的理论和应用介绍也被纳入其中
帮助我们更好地理解因果作用的传递机制
4. 将结合deepseek/Grok + Stata数据处理
借助最新人工智能大模型的力量,为科研助力,让数据处理和分析变得更加高效、智能
开课信息:
培训时间:2025年5月1-4日(四天)
培训安排:上午9:00-12:00;下午14:00-17:00;课后答疑
培训方式:
线上:腾讯会议同步直播参会备注:
参加现场提供交通住宿指南,会议酒店住宿提供协议价(含早);
现场班根据缴费顺序安排座位,现场名额限30人。
*现场与远程均提供录播回放,赵西亮老师亲自答疑。
*授课过程涉及实操,参加现场需携带电脑。
课程亮点:
1. 前沿理论与方法的深度剖析
深入学习统计推断的基本内容,从线性回归、饱和模型、二元选择模型,到带惩罚项的线性回归,如Lasso、岭回归等,再到Neyman正交、Double Lasso等前沿方法,让我们对参数估计方法有全面而深刻的理解。
同时,详细讲解潜在结果框架、因果图等理论基础,帮助我们构建坚实的因果推断理论体系。
2. 因果推断全流程的系统讲解
课程涵盖了因果推断的整个流程,从定义因果效应参数,到选择合适的识别策略,再到估计统计参数,每一步都详细讲解,让学员能够清晰地掌握因果推断的逻辑框架。
无论是随机化实验、非混杂性条件下的因果效应估计,还是工具变量法、固定效应方法、双重差分法等具体方法的应用,都有详尽的案例分析和实操指导。
3. 高维数据与因果推断的紧密结合
随着大数据时代的到来,高维数据成为了我们研究中常见的挑战。课程新增的高维协变量下的统计推断和因果推断方法,将帮助我们更好地应对这一挑战。通过学习Chernozhukov等人发展的理论,包括双重Lasso和双重机器学习等方法,学员能够掌握在高维数据环境下进行因果推断的有效途径。
4. 人工智能大模型的助力
结合DeepSeek/Grok + Stata数据处理,是本次课程的一大亮点。借助人工智能大模型的力量,我们可以更高效地进行数据编程和学术研究。这不仅能够提高数据处理的效率,还能为研究提供新的思路和方法,让学员在科研工作中如虎添翼。
5. 实战案例与实操指导
课程中将通过大量的实战案例,帮助学员更好地理解和应用所学知识。从班级规模与学习成绩的研究,到种族与就业歧视的分析,再到移民冲击和工资的影响等,这些案例覆盖了学术研究的多个领域,让学员能够将理论与实际相结合,提升解决实际问题的能力。同时,课程还提供实操指导,让学员在实践中掌握各种方法的应用技巧。
培训大纲
第1讲 统计推断
1) 线性回归、饱和模型、二元选择模型、方差估计
2) 带惩罚项的线性回归:偏差—方差权衡、交叉验证法、自助法(bootstrap)
3) Lasso、岭回归、Neyman正交、Double Lasso
第2讲 潜在结果框架
1) RCM(Rubin Causal Model)
2) 潜在结果
3) 分配机制(treatment assignment)
4) 因果效应参数(causal estimand)
5) 因果识别
6) 回归和因果识别
第3讲 因果图
1) 三种基本结构
2) 后门标准
3) 混杂偏差和样本选择偏差
4) 什么是好的控制变量和坏的控制变量
*前门标准
第4讲 随机化实验
1) 随机化实验的作用
2) 随机化实验为什么是黄金标准?
3) 随机化实验的分析
4) Design-based和sampling-based方差
案例:
① 班级规模与学习成绩(Krueger,1999)
② 种族与就业歧视(Bertrand and Mullainathan, 2004)
③ 竞选中名字在选票中的位置优势(Ho and Imai, 2006)
④ 媒体的影响(Chen and Yang,2019)
第5讲 非混杂性条件下的因果效应估计
最基本的识别条件是非混杂性(unconfoundedness),也称为条件独立性假设(CIA, Angristand Pischke 2009),或根据观测变量进行的选择(selection on theobservables)或可忽略性(ignorablity),是最基础的分配机制。这类策略的关键是通过(匹配)设计,模拟随机化实验。
1) 匹配、倾向指数匹配(PSM, Rosenbaum and Rubin, 1983; Abadie and Imbens, 2006)
2) 逆概率加权(Inverse probability weighting, IPW)
3) 回归调整(regression adjustment)
4) 双重稳健估计(double robust estimator)
5) 双重机器学习(double/debiased machine learning)
案例:
⑤ 培训的效果(Dehejiaand Wahba, 1999)
⑥ 精英大学的作用(Dale and Kreuger, 2002)
第6讲 工具变量法
工具变量法在模拟非依从的随机化实验。
1) 工具变量法的起源和基本思想
2) 工具变量法的基本识别条件
3) 如何选择工具变量,如何讨论工具变量的外生性条件?
4) 工具变量法的选择和说服审稿人的办法
5) 异质性因果效应下的工具变量法——LATE(Imbens and Angrist, 1994: Angrist, Imbens and Rubin, 1996)
6) 工具变量法和非依从的随机化实验(noncompliance RE)
7) 基于选择的工具变量法——Heckman两步法
8) *未观测因素为基础的选择MTE——边际干预效应框架(Heckman and Vytlacil, 1999;2005)
案例:
⑦ 出生季度和教育回报 (Angristand Krueger, 1991)
⑧ 参军与收入 (Angrist,1990)
⑨ 家庭规模和父母劳动供给 (Angrist and Lavy, 1998)
⑩ 美国的教育回报(Carneiro etal., 2011)
⑪ 全民儿童照护服务的收益 (Cornelissen, Dustmann andSchonbrg, 2018)。
第7讲 固定效应方法
1) 随机效应模型
2) 固定效应模型
3) Hausman检验
4) 固定效应是什么
5) 组内回归(within regression)和虚拟变量回归(LSDV)
6) Stata命令reg、xtreg、areg、reghdfe的关系
案例:
⑫ 双胞胎数据估计中国教育回报(Li, Liu and Zhang, 2012)
第8讲 经典双重差分法
双重差分法在模拟增量上的随机化实验,在线性假设下,属于固定效应模型。
1) 共同/平行趋势假设(Parallel/Common Trend Assumption)、无预期假设(no anticipation assumption)、无溢出效应假设(nospillover effects assumption)、共同区间假设(overlapassumption)
2) 经典DID的因果识别
3) 经典DID的参数估计:回归方法、PSM-DID(Heckman et al. 1997, 1998)、逆概率加权估计量(Abadie,2005)、双重稳健估计量(Sant’Anna and Zhao, 2020)
4) 如何在回归模型中引入不时变的协变量Xi和时变协变量Xit?
案例:
⑬ 移民冲击和工资(Card,1990)
⑭ 最低工资调整和就业(Card and Krueger, 1994)
⑮ 911事件对美国办公楼的影响(Abadie and Dermisi, 2008)
⑯ 大学扩招和大学生失业(邢春冰和李实,2011)
第9讲 多期单一政策DID
经典DID的扩展,扩展到多期,仍然只有一个干预组和一个控制组
1) 基本识别条件:平行趋势假设、无预期假设和无溢出效应假设的重新表述。
2) 平行趋势假设检验和动态模型构造(事件研究法设计)
3) 平行趋势检验方法和敏感性分析
4) 以个体出生年份(cohort)构成的DID,有时也称为cohortDID,并不是一种新的设计
案例:
⑰ 茶叶价格和消失的女性 (Qian,2008)
⑱ 土豆和人口及城市化 (Nunn and Qian, 2011)
第10讲 DID-IV设计
1) DID和IV的结合:不满足平行趋势时的新设计
2) 基本识别条件、因果识别过程
3) 三重差分法(DDD):一种特殊的工具变量法
4) 基本识别条件、因果识别过程
案例:
⑲ 印尼建校项目对教育回报的影响 (Duflo, 2001)
⑳ 强制福利对劳动力市场的影响 (Gruber, 1994)
第11讲 交错DID(staggered DID)
个体是逐渐受到政策影响的,不再只有单纯的干预组和控制组两组,而是有很多的干预组和控制组,而干预组被干预的时点不同,用这样的数据估计政策影响时,早期文献仍然沿用第10讲多期单一政策时的设计方法,采用双向固定效应模型(TWFE)估计,但最新的文献发现,在交错政策时,如果存在组间异质性(Goodman-Bacon, 2021)和时间上异质性(Sun andAbraham, 2021)时,TWFE估计量存在着偏差,事件研究法存在着污染偏差(Contamination bias)。
1) 基本识别条件的讨论
2) TWFE估计量在估计什么(Goodman-Bacon,2021; de Chaisemartin and D'Haultfoeuille, 2020)
· Goodman-Bacon分解
3) 事件研究法存在的偏差(Sun and Abraham, 2021)
4) 如果正确的估计因果效应:
· Callaway and Santa’Anna(2021)非参数估计量
· Wooldridge(2021)回归估计量
案例:
㉑ 大而坏的银行:放松管制与收入分配(Beck et al., 2010; Baker et al., 2022)
第12讲 缺失值填补方法
1) 缺失值填补(Borusyak et al., 2021; Liu et al., 2021)
2) 合成控制法(Abadie et al., 2010)
3) 合成双重差分法(Arkhangelsky et al., 2021)
4) 广义合成控制法(Xu, 2017)
案例:
㉒ 加州控烟法案的效果(Abadieet al., 2010)
㉓ 德国统一的经济影响(Abadie et al., 2015)
第13讲 断点回归设计
最接近于完全随机化实验的研究设计,教育学家发明(Thistlethwaite and Compbell, 1960),作者认为价值不大,但被经济学家挖掘出来,焕发异彩(Hahn et al. 2001)。本章讨论RDD、Fuzzy RDD、Kink RDD的基本识别条件、估计方法、带宽选择方法等。
1) 精确断点回归设计:局部随机化假设、连续性假设
2) 模糊断点回归设计:工具变量法
3) 弯折断点回归设计:导数上的断点
案例:
㉔ 美国政党的在位优势 (Lee,2008)
㉕ 空气污染和寿命 (Chen et al., 2013;Ebenstein et al., 2017)
㉖ 学区房的价值 (Black, 1999)
㉗ 户口的价值(Chen et al., 2019)
第14讲 因果中介分析
1) 传统中介分析理论
2) 自然间接效应(中介效应)、自然直接效应、控制直接效应
3) 因果中介效应的基本识别条件:序贯可忽略性
4) 工具变量因果中介模型
案例:
㉘ 教育通过职业影响收入的因果中介分析
获取培训通知、会议邀请联系人:
JG学术刘老师
TEL:18600257362
WX:jgzjwanzi


135 个论坛币



雷达卡








京公网安备 11010802022788号







