楼主: bellman2010
17840 17

[面板数据求助] 描述性统计中的变量个数与实际回归用到的变量个数不相等是为什么? [推广有奖]

  • 13关注
  • 5粉丝

学科带头人

94%

还不是VIP/贵宾

-

威望
0
论坛币
590 个
通用积分
352.7100
学术水平
32 点
热心指数
24 点
信用等级
19 点
经验
1317 点
帖子
459
精华
0
在线时间
5088 小时
注册时间
2013-1-29
最后登录
2024-5-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

在描述性统计中,我的主要被解释变量和解释变量样本量基本在30000多。在没有控制其他变量的情况下,只做面板数据基本回归 xtreg y x i.year,fe cluster(city),样本量减少为18000多,逐步加入其它控制变量样本量就逐渐减少,尤其是控制了两个变量就减少到1000多。但这两个变量在描述性统计中分别有15000和6700的样本量。为什么回归后样本量减少这么多呢?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:描述性统计 变量个数 描述性 Cluster xtreg

沙发
黃河泉 在职认证  发表于 2018-11-9 16:15:26 |只看作者 |坛友微信交流群
简单而言,就是有存在 missing values。
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 + 1 正解

总评分: 论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

藤椅
bellman2010 发表于 2018-11-9 16:50:18 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-11-9 16:15
简单而言,就是有存在 missing values。
请问描述性统计时如何去掉missing values呢?感谢版主。

使用道具

板凳
黃河泉 在职认证  发表于 2018-11-9 17:08:16 |只看作者 |坛友微信交流群
bellman2010 发表于 2018-11-9 16:50
请问描述性统计时如何去掉missing values呢?感谢版主。
请参考
  1. sysuse nlsw88.dta, clear
  2. sum wage hours tenure union

  3. foreach v of varlist wage hours tenure union {
  4.   drop if `v' == .
  5. }  

  6. sum wage hours tenure union

  7. reg wage hours tenure
  8. reg wage hours union
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Stakiny + 2 + 2 + 2 精彩帖子

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

使用道具

报纸
黃河泉 在职认证  发表于 2018-11-9 17:08:43 |只看作者 |坛友微信交流群
bellman2010 发表于 2018-11-9 16:50
请问描述性统计时如何去掉missing values呢?感谢版主。
  1. . sysuse nlsw88.dta, clear
  2. (NLSW, 1988 extract)

  3. .
  4. . sum wage hours tenure union

  5.     Variable |        Obs        Mean    Std. Dev.       Min        Max
  6. -------------+---------------------------------------------------------
  7.         wage |      2,246    7.766949    5.755523   1.004952   40.74659
  8.        hours |      2,242    37.21811    10.50914          1         80
  9.       tenure |      2,231     5.97785    5.510331          0   25.91667
  10.        union |      1,878    .2454739    .4304825          0          1

  11. .
  12. . foreach v of varlist wage hours tenure union {
  13.   2.   drop if `v' == .
  14.   3. }  
  15. (0 observations deleted)
  16. (4 observations deleted)
  17. (15 observations deleted)
  18. (360 observations deleted)

  19. .
  20. . sum wage hours tenure union

  21.     Variable |        Obs        Mean    Std. Dev.       Min        Max
  22. -------------+---------------------------------------------------------
  23.         wage |      1,867     7.58762    4.168964   1.344605   39.23074
  24.        hours |      1,867    37.61007    9.963119          1         80
  25.       tenure |      1,867    6.567488    5.640066          0   25.91667
  26.        union |      1,867    .2463846    .4310206          0          1

  27. .
  28. . reg wage hours tenure

  29.       Source |       SS           df       MS      Number of obs   =     1,867
  30. -------------+----------------------------------   F(2, 1864)      =     81.84
  31.        Model |  2617.89903         2  1308.94952   Prob > F        =    0.0000
  32.     Residual |  29813.6624     1,864  15.9944541   R-squared       =    0.0807
  33. -------------+----------------------------------   Adj R-squared   =    0.0797
  34.        Total |  32431.5615     1,866   17.380258   Root MSE        =    3.9993

  35. ------------------------------------------------------------------------------
  36.         wage |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
  37. -------------+----------------------------------------------------------------
  38.        hours |    .041123   .0094084     4.37   0.000      .022671    .0595751
  39.       tenure |   .1860066   .0166198    11.19   0.000     .1534112    .2186019
  40.        _cons |   4.819383   .3655205    13.18   0.000     4.102511    5.536256
  41. ------------------------------------------------------------------------------

  42. . reg wage hours union

  43.       Source |       SS           df       MS      Number of obs   =     1,867
  44. -------------+----------------------------------   F(2, 1864)      =     38.00
  45.        Model |  1270.56143         2  635.280717   Prob > F        =    0.0000
  46.     Residual |       31161     1,864  16.7172747   R-squared       =    0.0392
  47. -------------+----------------------------------   Adj R-squared   =    0.0381
  48.        Total |  32431.5615     1,866   17.380258   Root MSE        =    4.0887

  49. ------------------------------------------------------------------------------
  50.         wage |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
  51. -------------+----------------------------------------------------------------
  52.        hours |   .0539032   .0095185     5.66   0.000     .0352352    .0725711
  53.        union |   1.378362   .2200208     6.26   0.000     .9468494    1.809875
  54.        _cons |   5.220711   .3710056    14.07   0.000     4.493081    5.948341
  55. ------------------------------------------------------------------------------
复制代码

使用道具

地板
bellman2010 发表于 2018-11-10 17:18:09 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-11-9 17:08
感谢!

使用道具

7
没词儿1 学生认证  发表于 2019-3-7 12:09:44 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-11-9 17:08
请参考
请问变量的样本量不一样也可以直接进行logit和tobit回归吗?我尝试了一下可以回归出结果,但是不知道这样是不是正确的。

使用道具

8
黃河泉 在职认证  发表于 2019-3-7 14:53:54 |只看作者 |坛友微信交流群
没词儿1 发表于 2019-3-7 12:09
请问变量的样本量不一样也可以直接进行logit和tobit回归吗?我尝试了一下可以回归出结果,但是不知道这样 ...
OK 的。

使用道具

9
M小白 发表于 2019-9-27 09:59:41 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-3-7 14:53
OK 的。
我像您这样做了,描述性统计和回归的样本量还是不一致

使用道具

10
黃河泉 在职认证  发表于 2019-9-27 17:10:20 |只看作者 |坛友微信交流群
M小白 发表于 2019-9-27 09:59
我像您这样做了,描述性统计和回归的样本量还是不一致
先将所有指令与结果发出来看看!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-25 16:07