楼主: 510319812
176609 51

[回归分析求助] stata reg回归后面加vce(cluster id )和不加有什么区别   [推广有奖]

11
夜影刀 发表于 2013-7-10 18:09:43 |只看作者 |坛友微信交流群
我曾经用PISA data 做regression,没有用cluster schoolid的时候,标准差特别小,与用pv command做出来不同,最后加上了cluster之后,标准差明显变大了

使用道具

12
hy6360298 发表于 2013-12-8 20:29:53 |只看作者 |坛友微信交流群
h3327156 发表于 2013-5-5 21:33
我的个人经验是,换一个id去cluster,
通常, id变量的分类分地越细, 那么标准误会较小些 【所以比较容 ...
表示加上去后 标准误变得相当大 系数不显著了 这个是加呢还是不加呢?

使用道具

13
luisluan 发表于 2013-12-9 02:49:37 来自手机 |只看作者 |坛友微信交流群
hy6360298 发表于 2013-12-8 20:29
表示加上去后 标准误变得相当大 系数不显著了 这个是加呢还是不加呢?
可以考虑先分组,再加。不加是说不过去的,可以根据你研究的话题本身可能能找到一些分组方法,这些分组方法可能会大幅降低组间标准差,这样分别做结果可能就显著了

使用道具

14
arlionn 在职认证  发表于 2013-12-9 11:30:08 |只看作者 |坛友微信交流群
Qestion: 在 reg 命令中,robust 选项和 cluster(clustvar) 选项都能得到稳健的 SE,但两者的具体结果不同。我的理解是前者主要应对异方差,后者主要应对的是自相关,不知道是否如此?

但在 xtreg 中,选项 vce(robust) 和vce(cluster clustvar) 得到的 SE 完全相同?为什么呢?而且你建议,应对异方差时用前者,应对截面相关时用后者。这是否意味着,这两个等价的选项能同时应对异方差和截面相关呢?

Answer:
reg, robust 只在考虑异方差的情形下对标准误进行调整,采用的是 White (1980) 的三明治估计量;

xtset id year 后再执行 xtreg, robust 与执行 xtreg, vce(cluster id) 等价是从 Stata11 以后的版本开始的。这是编程中设定的。
如果你设定 xtreg, vce(cluster industry) 那么得到的结果就与 xtreg, robust 不同了。

xtreg, vce(cluster industry) 与 reg, vce(cluster industry) 的解释相同:假设干扰项在不同的行业之间彼此独立,但在同一个行业内部的不同的公司之间存在相关性。


同理,若设定 reg, vce(cluster year) 则相当于假设不同年度之间的干扰项彼此独立,但同一个年度上的所有公司之间的干扰项彼此相关。

再举一例,设定 reg, vce(cluster id) 相当于假设不同公司的干扰项彼此独立,但同一家公司不同年度上的干扰项彼此相关。

因此,设定 vce(cluster var) 并不一定意味着序列相关,关键在于 var 是什么变量。

(Note: 以上内容截取自我和一个朋友的邮件往来,表述不妥之处见谅。)
已有 18 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Dekiriohy + 1 + 1 + 1 精彩帖子
lvdeshenga + 1 + 1 精彩帖子
高鸽gg + 1 + 1 + 1 精彩帖子
123FFFYYY + 1 + 1 + 1 精彩帖子
嘟嘟翾 + 1 + 1 + 1 精彩帖子
ruanhaoya + 1 + 1 精彩帖子
阮阮阮冬阳 + 1 + 1 + 1 精彩帖子
常见5 + 1 + 1 + 1 精彩帖子
图图是秋阳 + 1 + 1 + 1 精彩帖子
花逝无痕梦丶 + 1 观点有启发

总评分: 经验 + 1  论坛币 + 3  学术水平 + 18  热心指数 + 16  信用等级 + 15   查看全部评分

使用道具

15
lsyjy 发表于 2013-12-22 12:00:40 |只看作者 |坛友微信交流群
谢谢老师。学习了。

使用道具

16
weihang 学生认证  发表于 2014-1-21 21:57:45 |只看作者 |坛友微信交流群
14楼连老师给的意见是很明确了 估计楼主是把cluster id和cluster time的含义搞反了 所以你试试cluster time 说不定你想要的变量仍然是显著的

使用道具

17
ellepan 在职认证  发表于 2014-1-26 18:56:32 |只看作者 |坛友微信交流群
千年放逐 发表于 2012-12-12 04:33
这个应该主要是矫正面板的标准差的吧。
面板数据做回归的时候,如果不加cluster选项,默认的标准差假定模型 ...
求教:cluster()和robust有什么区别呢?如何判断应该使用哪一个?

使用道具

18
siline 发表于 2014-2-12 15:17:14 |只看作者 |坛友微信交流群
ellepan 发表于 2014-1-26 18:56
求教:cluster()和robust有什么区别呢?如何判断应该使用哪一个?
robust是指异方差,你可以随时都用
cluster是指某个变量在一个层级上高度相关,比如分析每个城市的GDP,其中一项是每个省的institutions level,那个这个变量对同一个省的城市是一样的,那么就要用cluster。cluster的significance killer,但是该用的时候只能用
已有 1 人评分经验 论坛币 收起 理由
葫芦娃大王 + 1 + 1 精彩帖子

总评分: 经验 + 1  论坛币 + 1   查看全部评分

使用道具

19
yzhang005 发表于 2014-10-5 13:22:45 |只看作者 |坛友微信交流群
arlionn 发表于 2013-12-9 11:30
Qestion: 在 reg 命令中,robust 选项和 cluster(clustvar) 选项都能得到稳健的 SE,但两者的具体结果不同。 ...
请教连老师,如果想cluster多个变量,可怎么做呀?

使用道具

20
似水24 发表于 2014-10-7 18:29:05 |只看作者 |坛友微信交流群
学习了!!!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 21:50