楼主: ewfwedwd
6650 0

[其他] 选取某年数值作为工具变量 [推广有奖]

  • 0关注
  • 1粉丝

svip1

已卖:423份资源

学科带头人

10%

还不是VIP/贵宾

-

威望
0
论坛币
1313 个
通用积分
456.6953
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
12600 点
帖子
903
精华
0
在线时间
220 小时
注册时间
2022-11-18
最后登录
2026-1-30

楼主
ewfwedwd 发表于 2025-8-5 19:49:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

结论先行
以某一年的数值做工具变量(IV)在面板数据里可行,但必须解决随时间不变带来的第一阶段无变化问题。标准做法有三条:

该年值本身只作为截面IV,需要再乘以一个随时间变化的调节变量Bartik 交互);

把该年值当作初始条件,与滞后/差分的时变变量结合,得到时变IV

直接采用该年值的一阶滞后t-1 t-k)充当时序IV,前提满足外生性。

下面给出判定步骤、Stata/R 代码模板及常见误区。





何时可以只用某年值


情形

举例

是否可直接用

需满足条件

纯截面数据

1998 年土地超编人数 → 2015 年土地扭曲

1998 年值与 2015 年扰动项无关

面板数据

1984 年邮电用户数 → 2020 年数字经济

1984 值不随时间变,导致第一阶段 F≈0

面板+Bartik

1984×上年网民增速 当年数字经济

交互项随时间变,F>10





三条可行构造方案(含代码)


方案 A:截面 IV + 时变变量交互(最常用)


stata

* 1984 年邮电用户作为截面 IVgen iv_bartik = tele84 * net_growthivreghdfe y (x = iv_bartik) controls, absorb(id year) cluster(id)estat firststage   // F>10 则通过


方案 B:把某年值当初始条件,差分/滞后


stata

* 1998 年超编人数×(当期机构数-1998 机构数)gen iv_diff = over98 * (institution_t - institution_98)xtivreg2 y x controls (x = iv_diff), fe cluster(id)


方案 C:直接使用该年值的一阶滞后


stata

gen Lx_iv = L.x  // 滞后一期xtivreg2 y x controls (x = Lx_iv), fe cluster(id)


注意:滞后项必须满足外生性——当期扰动项不包含滞后项影响。





必须报告的三项检验



检验

命令

判断标准

第一阶段 F

estat firststage

F>10(弱工具)

不可识别 LM

estat firststage, forcenonrobust

p<0.05

过度识别 Hansen J

estat overid

p>0.1





常见误区提醒

误区 1:直接把 1998 年数值塞进面板模型做 IV → 第一阶段 F 极低。
解决:务必通过交互或差分使其随时间变化。

误区 2:认为历史数据一定外生” → 需论证该年值与当期 ε 无关(政策外生、技术外生)。

误区 3:既做交互又做分组 方法重复,择一即可。





一句话总结
某年值只有与时变动量结合滞后处理后才能成为有效面板 IV,否则第一阶段会失效;写论文时务必给出相关性 + 外生性 + 三项检验的完整证据链。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:工具变量 Institution Controls Cluster control

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-31 01:02