楼主: runman
48096 28

[回归分析求助] 关于回归模型中是否需要加入截距项的问题 [推广有奖]

学科带头人

77%

还不是VIP/贵宾

-

威望
0
论坛币
2252 个
通用积分
27.5974
学术水平
8 点
热心指数
9 点
信用等级
8 点
经验
51532 点
帖子
979
精华
0
在线时间
3793 小时
注册时间
2010-4-3
最后登录
2025-11-24

楼主
runman 发表于 2015-12-14 21:01:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

目前在写一篇论文,在做回归模型时,发现只要加入截距项,很多关键系数就变得不显著,甚至符号也变得与预期不符了。

但是如果去掉截距项,系数都非常显著,并且符号与预期一样。

即使不加入截距项,回归模型并不违背经济学意义与经济常识。

但与我所写论文方向相关的文献,在研究类似问题时候,模型都考虑了有常数项的情况。

我想请教大家的是:

1.回归模型一定要加常数项吗?

2.如果模型不加常数项,审稿人会不会质疑结论的稳健性?

3.如果模型不加常数项,是否能够通过被解释变量的替换,重要解释变量的替换,尝试新的回归方法等方式来证明结论的稳健性。


在此先谢过大家了。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:回归模型 截距项 经济学意义 解释变量 有常数项 统计

沙发
xddlovejiao1314 学生认证  发表于 2015-12-14 21:07:04
   就我个人所知,一般还是要加常数项的,因为在构建R^2时需要用到常数项。你现在出现的问题我怀疑可能是以下原因造成的结果不稳健:一是原始数据含有极端异常值/异常差,你没有做相应的处理就建模了;二是自变量间可能存在严重多重共线性。所以我的建议是先对数据一些预处理和诊断,然后再建模。祝好运~
已有 1 人评分经验 热心指数 收起 理由
夏目贵志 + 5 + 1 热心帮助其他会员

总评分: 经验 + 5  热心指数 + 1   查看全部评分

藤椅
runman 发表于 2015-12-14 22:09:11
xddlovejiao1314 发表于 2015-12-14 21:07
就我个人所知,一般还是要加常数项的,因为在构建R^2时需要用到常数项。你现在出现的问题我怀疑可能是以 ...
你好,先感谢回复

我用的stata软件,进行普通的OLS回归,后面加noconstant就能实现不带常数项的OLS回归

回归反馈统计信息中是可以反馈R2、调整R2等一系列信息的

你提到的问题,我们也考虑到了

建立模型时候,我们参考了先前的相关文献

包括对被解释变量取自然对数,解释变量滞后一期等

但是,只要已加入常数项,关键系数的符号就会出现混乱,或者非常不显著,替换指标,进行稳定性检验情况类似

板凳
xddlovejiao1314 学生认证  发表于 2015-12-14 23:43:46
runman 发表于 2015-12-14 22:09
你好,先感谢回复

我用的stata软件,进行普通的OLS回归,后面加noconstant就能实现不带常数项的OLS回归 ...
第一次遇到这种情况,看看其它坛友遇到过类似问题没额。祝好运~

报纸
夏目贵志 发表于 2015-12-15 05:37:32
runman 发表于 2015-12-14 22:09
你好,先感谢回复

我用的stata软件,进行普通的OLS回归,后面加noconstant就能实现不带常数项的OLS回归 ...
一般来说还是需要常数项的。除非你有什么理论依据说明不用加入。因为就算在不需要常数项的情况下加入常数项,而常数项不显著,也不会对结果有什么特别不好的影响。

至于你说的情况,首先从数据上说肯定是可能出现的。所以关键在于你研究的具体问题和建立的具体模型。你要是想进一步讨论的话可以说明一下你研究的是什么,用的什么变量,什么命令,然后发一部分数据出来让大家看看。

地板
runman 发表于 2015-12-15 08:54:53
xddlovejiao1314 发表于 2015-12-14 23:43
第一次遇到这种情况,看看其它坛友遇到过类似问题没额。祝好运~
好的,谢谢

7
runman 发表于 2015-12-15 09:00:55
夏目贵志 发表于 2015-12-15 05:37
一般来说还是需要常数项的。除非你有什么理论依据说明不用加入。因为就算在不需要常数项的情况下加入常数 ...
谢谢回复

加入常数项后,实证模型回归包括任何方式的稳定性检验的回归结果中,常数项都是1%的水平上显著的。

但其他项的系数就变得不显著,符号也出现与预期不符的情况。

你的建议我认真考虑一下,如何与大家进行更好地交流,再次感谢。

8
夏目贵志 发表于 2015-12-15 09:02:58
runman 发表于 2015-12-15 09:00
谢谢回复

加入常数项后,实证模型回归包括任何方式的稳定性检验的回归结果中,常数项都是1%的水平上显 ...
另外也可以试一下把所有的数据都标准化之后进行回归

9
runman 发表于 2015-12-15 09:07:49
夏目贵志 发表于 2015-12-15 09:02
另外也可以试一下把所有的数据都标准化之后进行回归
这个我也想到了

我咨询过教计量的老师

“对数据进行取对数或差分处理,只是经济学意义上的解释方面会有不同,可以尝试,但不要轻易尝试对数据进行标准化,这样会损失很多信息”

10
夏目贵志 发表于 2015-12-15 11:59:13
runman 发表于 2015-12-15 09:07
这个我也想到了

我咨询过教计量的老师
也许你们老师说的时候有特定的上下文。但是就你引用的这个部分来说,这个说法是不正确的。标准化其实不外乎于对数据加上一个常数除以一个常数。虽然这改变了数据的均值和方差,但是并不会导致什么“信息损失”。你看下面这个例子就明白了。标准化之前和之后的回归除了常数项以外,别的自变量的t值和回归的R方都是完全一样的。

何况我建议你尝试一下这种方法并不是说要你最终使用这个方法并且报告这个结果。只是这种方法可以消除常数项的影响,方便更好的看到自变量的效果。作为一种分析数据的手段,数据标准化之后回归还是很好用的。
  1. . sysuse auto
  2. (1978 Automobile Data)
  3. r; t=0.00 22:53:28

  4. . reg price weight turn

  5.       Source |       SS           df       MS      Number of obs   =        74
  6. -------------+----------------------------------   F(2, 71)        =     21.54
  7.        Model |   239799649         2   119899825   Prob > F        =    0.0000
  8.     Residual |   395265747        71  5567123.19   R-squared       =    0.3776
  9. -------------+----------------------------------   Adj R-squared   =    0.3601
  10.        Total |   635065396        73  8699525.97   Root MSE        =    2359.5

  11. ------------------------------------------------------------------------------
  12.        price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
  13. -------------+----------------------------------------------------------------
  14.       weight |   3.914597   .6905142     5.67   0.000     2.537751    5.291444
  15.         turn |  -385.3904   121.9868    -3.16   0.002    -628.6252   -142.1556
  16.        _cons |   9625.498   3243.744     2.97   0.004     3157.656    16093.34
  17. ------------------------------------------------------------------------------
  18. r; t=0.30 22:53:32

  19. . egen std_price =std(price)
  20. r; t=0.00 22:53:46

  21. . egen std_weight =std(weight)
  22. r; t=0.00 22:53:58

  23. . egen std_turn =std(turn)
  24. r; t=0.00 22:54:06

  25. . reg std_price std_weight std_turn

  26.       Source |       SS           df       MS      Number of obs   =        74
  27. -------------+----------------------------------   F(2, 71)        =     21.54
  28.        Model |  27.5646798         2  13.7823399   Prob > F        =    0.0000
  29.     Residual |  45.4353206        71  .639934093   R-squared       =    0.3776
  30. -------------+----------------------------------   Adj R-squared   =    0.3601
  31.        Total |  73.0000004        73  1.00000001   Root MSE        =    .79996

  32. ------------------------------------------------------------------------------
  33.    std_price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
  34. -------------+----------------------------------------------------------------
  35.   std_weight |   1.031498   .1819508     5.67   0.000     .6686987    1.394298
  36.     std_turn |  -.5748334   .1819508    -3.16   0.002     -.937633   -.2120338
  37.        _cons |  -2.34e-10   .0929933    -0.00   1.000    -.1854234    .1854234
  38. ------------------------------------------------------------------------------
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 14:03