楼主: eric_yan
1925 2

[Stata高级班] 连老师,您好:) [推广有奖]

  • 1关注
  • 11粉丝

博士生

55%

还不是VIP/贵宾

-

威望
0
论坛币
379 个
通用积分
1.0047
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
250 点
帖子
173
精华
0
在线时间
250 小时
注册时间
2009-5-3
最后登录
2021-7-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
连老师,您好!
请问我是用的中国工业企业数据库,但是一个关键变量在2004年缺失(不是工业增加值,工业增加值我知道怎么弥补),请问遇到这种情况下该怎么办?
我看有些文章是直接删除2004年数据进行回归(例如我在一个权威期刊《经济学(季刊)》上面看到由于缺失2004年出口交货值,那个作者就直接删除2004年数据),请问这样可以么?投稿的话会不会被抓着把柄?这种情况下业界通用的处理办法又是什么呢?

谢谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:连老师 中国工业企业数据库 2004年数据 工业企业数据库 工业增加值 经济学 数据库 增加值 通用 中国

沙发
arlionn 在职认证  发表于 2015-1-14 09:11:48 |只看作者 |坛友微信交流群
       显然,这是不得以的处理方式。我认为具体的处理方法以及不同的处理方法的利弊要看你所研究的问题。
如果只是做截面差异比较,换言之,只是做简单的 FE 或 RE 估计,模型中没有涉及动态关系(例如,没有使用动态面板模型),则删除 2004 的数据不会对研究结论产生实质性的影响。
    然而,如果模型中有些变量使用的是对数形式,或者模型中包含了增长率之类的变量,则删除一年就会带来麻烦,因此,此时增长率的计算会出现问题。
    另一种处理方法就是使用插值或补漏的方式把 2004 的数据补充进来,但除非万不得已,这是一个最差的选择。毕竟,无论是采用何种方式补充 2004 的数据,我们都是基于现有信息集合来补充的,数据中并没有增加新的信息,但补漏的方法不当时,结果反而可能更加糟糕。

使用道具

藤椅
eric_yan 发表于 2015-2-14 10:34:48 |只看作者 |坛友微信交流群
arlionn 发表于 2015-1-14 09:11
显然,这是不得以的处理方式。我认为具体的处理方法以及不同的处理方法的利弊要看你所研究的问题。
...
为什么“模型中有些变量使用的是对数形式,或者模型中包含了增长率之类的变量,则删除一年就会带来麻烦”?第一,如果包含了增长率,那就跨一年计算2003和2005年的增长率,也不是有很大问题吧?第二,为什么对数形式也会带来麻烦?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 22:17