楼主: ywh19860616
6023 9

[其他] 工具变量数据排列疑问 [推广有奖]

学术权威

32%

还不是VIP/贵宾

-

威望
0
论坛币
870 个
通用积分
3873.4826
学术水平
858 点
热心指数
995 点
信用等级
641 点
经验
116330 点
帖子
3973
精华
0
在线时间
7730 小时
注册时间
2009-9-3
最后登录
2024-5-7

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在一般的论文中,如果说工具变量选择是取某个变量的滞后几阶,或者差分几阶,这些都可以直接生成,不用考虑数据排列格式

但是在有些文献中,当按经济含义选择工具变量时,往往选择是模型中没有的变量。
如我看到一篇文章上,数据年份是1990-2008年的
但是他选择1985年的人口数作为工具变量(这只是具个例子),那在stata中,这数据应该怎么存放啊。
其他的变量数据可是1990-2008,很多年,而工具变量数据只有一年,该怎么存贮?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:工具变量 1990-2008 Stata tata 经济含义 文章 论文 模型

沙发
h3327156 发表于 2010-7-19 20:46:31 |只看作者 |坛友微信交流群
我个人认为楼主您思考太细腻了!
我个人的小小见解是,【纯参考,也许我是错的,大家讨论讨论!】
他就是用过去期的工具变量罢了! 【这一点他很聪明!】
聪明就聪明在他可能可以回避掉工具变量与内生变数可能的covariance不为零的问题。
【一些想法,请参考iv与内生的相关探讨】
【只是可能回避掉,要真的挑毛病,还是会被挑的,一样请参考iv与内生的相关探讨,许多书都有】

我猜啦! 假设个体为a1 a2 a3 .... axxxx    如果有xxxx个个体
那么a1有1990-2008个
您的问题是,那假设他有个1985年iv,那要怎么弄?
您可以这样想,
ID个体     时间        1985人口数IV
a1           1990           888
a1            1991          888
a1            1992          888
.                 .                  .
.       .         .                 .
.                 .                  .
a2           1990          999
a2            1991          999
a2            1992          999

当然这是panel或pooled的资料。
我想要生成那样的iv变量,就不用我多废话了!

good luck~
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
ywh19860616 + 1 + 1 + 1 非常感谢

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

藤椅
ywh19860616 发表于 2010-7-19 23:32:07 |只看作者 |坛友微信交流群
非常感谢您的热心解答
很多时候,我们看到文献的工具变量选择都是直接生成滞后项或者差分项,而这些滞后项或者差分项可都有数据缺失的,所以我猜提出此疑问。当我选择某一年的数据作为工具变量时,数据排列问题。
看到楼上的解答,我想也可能是这样排列吧,只是不确信。
谢谢

再冒昧问下,您倾向于使用哪种工具变量?直接取滞后或者差分滞后,还是自己另外选择其他变量作为工具变量?

使用道具

板凳
h3327156 发表于 2010-7-20 09:15:28 |只看作者 |坛友微信交流群
嗯! 大胆假设,小心求证!
读文献能思考有疑问是好事。

我个人目前的研究是做卫生健康经济 【Health Economics】
关于工具变数...

1.我倾向于根据经济直觉而来。 【好像Wooldridge的书也比较建议这观点】
但上述这一点,常常文献被批,他们的作法,往往支持IV为强工具变数。
关于IV的另一个重要特质,即排除性往往忽略或不管。

2.根据文献而来。
2-1比较新的文献
在Health来说,近来我们流行的是关于Genetic IVs【基因工具变数】与非基因工具变数。
【基因就像常说的like father like son】【非基因我们常用个体间的家庭环境背景因素】
2-2传统文献
同样以Health来说,传统上也有直接取滞后或者差分滞后的。
但我必须强调,我们的差分,往往是用同卵双胞胎来进行差分 【直觉上来说,双胞胎的表现会很像】

3.如果没有感觉,经济直觉上找不到,那就凭计量而来,Lewbel's IV是一个不错的选择。
【您可以上网找找看 Lewbel IV】
他的IV,我跟我的老师觉得很难有经济意涵,但就计量角度来说,也许是一个不错的IV,
起码很容易会通过关于一个好IV的要求。
【Lewbel 2010曾应邀来台湾演讲,虽说他主题谈nonparametric,但如果找不到IV,他的IV可以参考,
因为他从计量理论上证明他的IV可行】

所以就我个人而言,
IV我习惯以1与2点来做,起码我比较好自圆其说,
至于Lewbel IV,当我实在找不到IV,且检定上又无法符合一个好IV该有的,那会使用之。
【当使用第3点时,我往往无法解释我的IV是什么意思,所以IV也常变成不是我paper或论文的重点了】

参考看看吧!

谢谢您给我评分^^
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
Sunknownay + 3 + 3 + 3 热心帮助其他会员
ywh19860616 + 1 + 1 + 1 非常感谢,您的回答解答了我疑惑

总评分: 学术水平 + 4  热心指数 + 4  信用等级 + 4   查看全部评分

使用道具

报纸
ywh19860616 发表于 2010-7-20 11:57:13 |只看作者 |坛友微信交流群
谢谢楼上的耐心指导
就我而言,选择工具变量看到较多的是按方法2.2,即取滞后项与差分项
对于您提到的第一点1和2.1,按照经济含义与最新文献来,这当然是最完美的,但是这个要求较高
必须对研究的经济理论有足够深入的理解

对于您提到的 Lewbel IV,还是第一次听说,非常感谢,找个时间一定好好拜读一下

谢谢

使用道具

地板
dogboy555 学生认证  发表于 2016-8-1 16:17:50 |只看作者 |坛友微信交流群
楼主你好~看到你的帖子,有个问题想请教下:

关于面板数据/时间序列数据,假设像您提到的年份覆盖1990-2008年,此时选择的工具变量只有一年:1985年的人口数。我疑问的点是:人口数是会随年份变化,那为什么给1990-2008这个时间段选IV不选同样时间长度的人口数(比方1985-2003年人口数)?
只觉得像贸易的IV地理距离是一个固定值,不必虽时间变化,那这种随时间变化的IV呢?

使用道具

7
xiaoyunxiaoming 发表于 2017-2-23 20:24:39 |只看作者 |坛友微信交流群
能不能麻烦您分享下您那篇用1985年人口数做工具变量的文献的名字?

使用道具

8
うめし 发表于 2017-6-4 10:38:07 |只看作者 |坛友微信交流群
楼主这个问题如何解决的呢?是否就是按照一楼所说的那样排列的,对于使用过去时期的截面数据作为面板估计的工具变量

使用道具

9
尐海煋 发表于 2020-3-12 01:36:14 |只看作者 |坛友微信交流群
在这篇文献里,金融发展水平的工具变量之一就是2000年各省份地区人均无偿献血水平SMc。《中国垂直一体化生产模式的决定因素——基于金融发展和不完全契约视角的实证分析》。

使用道具

10
尐海煋 发表于 2020-3-12 01:36:46 |只看作者 |坛友微信交流群
尐海煋 发表于 2020-3-12 01:36
在这篇文献里,金融发展水平的工具变量之一就是2000年各省份地区人均无偿献血水平SMc。《中国垂直一体化生产 ...
中国工业经济  2016年第3期

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-21 03:46