楼主: mooncrystal
30299 6

[回归分析求助] 求问,为啥取对数之后结果过于显著,而且系数符号也变了? [推广有奖]

  • 0关注
  • 2粉丝

讲师

98%

还不是VIP/贵宾

-

威望
0
论坛币
16158 个
通用积分
1.7962
学术水平
12 点
热心指数
10 点
信用等级
6 点
经验
7907 点
帖子
282
精华
0
在线时间
977 小时
注册时间
2011-4-3
最后登录
2022-10-21

楼主
mooncrystal 发表于 2014-12-21 13:51:07 |AI写论文
100论坛币
求问,就是最简单的回归,
reg y x1 x2 x3.....robust
这一结果做出来x1的系数符号是负的,然后整个结果看上去也没有很显著,算是比较general的结果。

可是y取了对数之后,reg lny x1 x2 x3.....robust
每一个系数都特别特别显著,p=0.000之类,一看就不正常,而且不论加了多少其他的x',结果都如此,而且x1的估计系数符号也变成正的了。。。
被震惊了。。。check 了raw data,也没有什么异常的地方。
求问有大神遇到过这种情况吗?是为什么呀?
我个人的看法是可能取了对数之后ln y的variance太小,x的variance太大。可是之前也有过这样的case,好像也没有什么特别之处啊。。。。非常感谢!!

关键词:取对数 variance General robust varian general 而且

沙发
Alfred_G 学生认证  发表于 2014-12-21 16:58:17
因为reg用的是OLS,普通线性回归虽然是最简单的回归,但对于数据的性质要求最高最严格。
因变量直接回归可能导致不显著,取对数之后变的显著,而且系数方向会变化。说明因变量的分布在取对数之后有着明显的变化。
建议你检验一下Y的分布,做个pp图,看一下它的趋势(±0.05)。如果原数据非正态,取对数以后正态分布,那么就说明取对数是有意义的。如果反之,原数据本身Y就是正态分布,那就不需要对数化。问题可能出在模型设置和变量选择上。
我觉得,楼主的问题在理论和实践中经常遇到,而且,越是这种看似简单的模型有的时候陷阱越多。
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
crystal8832 + 10 + 1 + 1 热心帮助其他会员
SpencerMeng + 25 + 1 + 2 + 1 观点有启发

总评分: 论坛币 + 35  学术水平 + 2  热心指数 + 3  信用等级 + 1   查看全部评分

藤椅
mooncrystal 发表于 2014-12-21 17:24:55
非常感谢!!
我看了y的分布图,有很多特异值,应该是需要log的,但是log之后,每个x系数的估计结果都如此显著,看着不太正常,很担心会不会是有什么问题啊。。。?btw:我的Y是连续变量,x是离散变量,有可能和这个有关吗?
再次感谢!!

板凳
625928915 学生认证  发表于 2014-12-21 22:19:19
貌似不是很懂,友情帮顶

报纸
Alfred_G 学生认证  发表于 2014-12-22 00:26:04
mooncrystal 发表于 2014-12-21 17:24
非常感谢!!
我看了y的分布图,有很多特异值,应该是需要log的,但是log之后,每个x系数的估计结果都如此 ...
我觉得有可能是因为自变量太少(如果按照问题中给出的三个的话),而且都是分类变量,预测的效度肯定会打折扣。自变量太少的话,如果不考虑嵌套模型或者更多自变量的模型的话,可能会出现遗漏变量的问题。
建议楼主再考虑下模型设置。
另:特异质的相关论述,好像不少教程都涉及,离群值检验和处理
https://bbs.pinggu.org/forum.php? ... amp;from^^uid=4774916
论坛中的帖子~

地板
mooncrystal 发表于 2014-12-22 10:39:49
Alfred_G 发表于 2014-12-22 00:26
我觉得有可能是因为自变量太少(如果按照问题中给出的三个的话),而且都是分类变量,预测的效度肯定会打 ...
嗯嗯,我再去试试看,非常感谢!!

7
xiaoge1990 发表于 2019-9-17 20:25:52
请问楼主最后是怎么解决的啊

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 16:38