楼主: kenjicx
25075 13

[其他] 时间虚拟变量因为多重共线性被删除!求教! [推广有奖]

  • 0关注
  • 0粉丝

高中生

57%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
204 点
帖子
14
精华
0
在线时间
45 小时
注册时间
2010-2-8
最后登录
2015-5-19

楼主
kenjicx 发表于 2012-2-13 22:14:15 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
RT,使用面板tobit的模型,年份是9年,行业40个,设置了年份虚拟变量和行业虚拟变量,回归过程中使用year1-year8 以及industry1-industry39控制时间和行业固定效应,结果回归时Stata删掉了3年的虚拟变量,提示是因为多重共线性。不明白多重共线性问题的出现是因为什么,麻烦高手解答~以及有什么解救办法!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多重共线性 虚拟变量 多重共线 共线性 Industry 模型 行业

沙发
xjc197522811 发表于 2012-2-13 22:54:23
高手们,快出来吧!有难题了哦。

藤椅
蓝色 发表于 2012-2-13 23:18:31 来自手机
没有数据不知道什么原因

板凳
kenjicx 发表于 2012-2-14 09:02:45
蓝色 发表于 2012-2-13 23:18
没有数据不知道什么原因
tsset num year
       panel variable:  num (unbalanced)
        time variable:  ye, 1999 to 2007, but with gaps
                delta:  1 unit

tabulate year,gen(year)

       year |      Freq.     Percent        Cum.
------------+-----------------------------------
       1999 |    145,031        7.55        7.55
       2000 |    146,318        7.62       15.17
       2001 |    154,644        8.05       23.22
       2002 |    163,823        8.53       31.75
       2003 |    180,898        9.42       41.16
       2004 |    256,534       13.35       54.52
       2005 |    258,137       13.44       67.95
       2006 |    282,204       14.69       82.64
       2007 |    333,388       17.36      100.00
------------+-----------------------------------
      Total |  1,920,977      100.00

tabulate indus_2,gen(industry)
这个就不贴了~. tobit y x1 x2 x3 x4 x4^2 x5  x6 x7 x8 x9 x9^2  stateown private other
>  gangaotai  year1- year8  industry1- industry39,ll(0)
note: year1 omitted because of collinearity
note: year2 omitted because of collinearity
note: year6 omitted because of collinearity

Tobit regression                                  Number of obs   =    1045997
                                                         LR chi2(59)     =   70338.94
                                                         Prob > chi2     =     0.0000
Log likelihood = -460667.43                        Pseudo R2       =     0.0709

------------------------------------------------------------------------------
       randd |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          x1 |  -1.86e-08   6.51e-09    -2.85   0.004    -3.13e-08   -5.82e-09
         x2 |   .0119829   .0000573   209.10   0.000     .0118706    .0120953
         x3 |  -7.25e-07   6.14e-08   -11.81   0.000    -8.46e-07   -6.05e-07
        x4 |  -.0643339   .0149713    -4.30   0.000    -.0936772   -.0349905
    x4^2  |   .0246831   .0008043    30.69   0.000     .0231067    .0262594
        x5 |   .0076249   .0003656    20.85   0.000     .0069083    .0083415
       x6 |   .0002349   .0000246     9.56   0.000     .0001867     .000283
       x7|   .1626048   .0007775   209.15   0.000      .161081    .1641286
       x8|  -.0000214   2.05e-06   -10.47   0.000    -.0000254   -.0000174
        x9 |   3.339469   .1395447    23.93   0.000     3.065966    3.612972
      x9^2  |  -.0880561   .0039834   -22.11   0.000    -.0958634   -.0802488
    stateown |   .0329428   .0210042     1.57   0.117    -.0082248    .0741103
     private |   .1136428   .0142611     7.97   0.000     .0856915    .1415942
       other |   .2975666   .0143083    20.80   0.000     .2695229    .3256103
   gangaotai |  -.1062617    .017275    -6.15   0.000      -.14012   -.0724034
       year1 |  (omitted)
       year2 |  (omitted)
       year3 |   .1310946   .0152406     8.60   0.000     .1012235    .1609657
       year4 |   .2648598   .0140378    18.87   0.000     .2373462    .2923733
       year5 |   .3128813   .0134618    23.24   0.000     .2864965     .339266
       year6 |  (omitted)
       year7 |  -.0868795   .0123782    -7.02   0.000    -.1111403   -.0626186
       year8 |  -.0252703   .0119969    -2.11   0.035    -.0487839   -.0017567
     行业因素   控制
       _cons |  -7.296448     .10994   -66.37   0.000    -7.511927    -7.08097
-------------+----------------------------------------------------------------
      /sigma |    2.31803   .0045694                      2.309074    2.326986
------------------------------------------------------------------------------
  Obs. summary:     916709  left-censored observations at y<=0
                    129288     uncensored observations
                         0 right-censored observations
其中x1-x3是主要解释变量。后面控制了所有制因素、年份和行业。去掉年份虚拟变量回归一切就很正常。
希望高手解惑,多谢多谢!!

报纸
蓝色 发表于 2012-2-14 14:13:00
所有制因素、年份和行业这些变量你看看是否共线

地板
rocn0190 发表于 2012-2-14 23:03:29
想请问year的问题:
1.每年设一个dummy(如楼主9年设8个dummy)
2.仅仅设一个year变数(如楼主1999有145,031个样本,这些样本的year就赋予1999这个值;
2000有146,318,这些就赋予2000这个值...以此类推至2007的333,388就赋予2007)

这样子各有何利弊?不知哪位高手能够解答,谢谢!

7
binggol 发表于 2012-2-15 09:45:52
你这个不是面板tobit模型 你这个是pool的tobit模型 混合截面数据  然后加入了时间 个体固定效应而已 你直接用xttobit 不需要加任何虚拟变量

8
Durra08 发表于 2012-3-14 17:22:11
可以检查下变量之间的相关性,相关性高也说明可能存在多重共线性

9
于果 发表于 2017-1-22 23:54:17
蓝色 发表于 2012-2-14 14:13
所有制因素、年份和行业这些变量你看看是否共线
版主,我的数据在做皮尔森相关分析时,年份与行业系数0.54.固定效应模型加入年度和行业被ommited。请问这种情况是你说的共线吗?真的是做论文急求,感激涕零啊

10
saly@123 发表于 2017-5-17 09:38:53
binggol 发表于 2012-2-15 09:45
你这个不是面板tobit模型 你这个是pool的tobit模型 混合截面数据  然后加入了时间 个体固定效应而已 你直接 ...
xttobit不需要加虚拟变量就能考虑时间效应和个体效应吗?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-20 12:22