结论先行
“以某一年的数值”做工具变量(IV)在面板数据里可行,但必须解决随时间不变带来的第一阶段无变化问题。标准做法有三条:
该年值本身只作为截面IV,需要再乘以一个随时间变化的调节变量(Bartik 交互);
把该年值当作初始条件,与滞后/差分的时变变量结合,得到时变IV;
直接采用该年值的一阶滞后(t-1 或 t-k)充当时序IV,前提满足外生性。
下面给出判定步骤、Stata/R 代码模板及常见误区。
① 何时可以只用“某年值”
情形 | 举例 | 是否可直接用 | 需满足条件 |
纯截面数据 | 1998 年土地超编人数 → 2015 年土地扭曲 | ✅ | 1998 年值与 2015 年扰动项无关 |
面板数据 | 1984 年邮电用户数 → 2020 年数字经济 | ❌ | 1984 值不随时间变,导致第一阶段 F≈0 |
面板+Bartik | 1984×上年网民增速 → 当年数字经济 | ✅ | 交互项随时间变,F>10 |
② 三条可行构造方案(含代码)
方案 A:截面 IV + 时变变量交互(最常用)
stata
* 1984 年邮电用户作为截面 IVgen iv_bartik = tele84 * net_growthivreghdfe y (x = iv_bartik) controls, absorb(id year) cluster(id)estat firststage // F>10 则通过
方案 B:把“某年值”当初始条件,差分/滞后
stata
* 用 1998 年超编人数×(当期机构数-1998 机构数)gen iv_diff = over98 * (institution_t - institution_98)xtivreg2 y x controls (x = iv_diff), fe cluster(id)
方案 C:直接使用该年值的一阶滞后
stata
gen Lx_iv = L.x // 滞后一期xtivreg2 y x controls (x = Lx_iv), fe cluster(id)
注意:滞后项必须满足外生性——当期扰动项不包含滞后项影响。
③ 必须报告的三项检验
检验 | 命令 | 判断标准 |
第一阶段 F | estat firststage | F>10(弱工具) |
不可识别 LM | estat firststage, forcenonrobust | p<0.05 |
过度识别 Hansen J | estat overid | p>0.1 |
④ 常见误区提醒
误区 1:直接把 1998 年数值塞进面板模型做 IV → 第一阶段 F 极低。
解决:务必通过交互或差分使其随时间变化。
误区 2:认为“历史数据一定外生” → 需论证该年值与当期 ε 无关(政策外生、技术外生)。
误区 3:既做交互又做分组 → 方法重复,择一即可。
一句话总结
“某年值”只有与时变动量结合或滞后处理后才能成为有效面板 IV,否则第一阶段会失效;写论文时务必给出相关性 + 外生性 + 三项检验的完整证据链。


雷达卡


京公网安备 11010802022788号







