楼主: han1234567
17882 12

[回归分析求助] 关于行业虚拟变量~~着急 [推广有奖]

  • 0关注
  • 0粉丝

博士生

62%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
8160 点
帖子
158
精华
0
在线时间
406 小时
注册时间
2009-7-22
最后登录
2016-9-10

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有21个行业,  设置了 20个行业虚拟变量, 为什么stata 在回归结果中, 显示因共线删除了3个行业虚拟变量,   
还有 为什么当选择不同的基准行业(比如 一次是将行业1作为基准回归 , 另一次是将行业2作为基准回归). 解释变量的系数会有变化,甚至符号都变了~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:虚拟变量 Stata tata 解释变量 回归结果 行业

沙发
蓝色 发表于 2011-9-23 08:03:52 |只看作者 |坛友微信交流群
把结果贴出来

使用道具

藤椅
han1234567 发表于 2011-9-23 08:32:02 |只看作者 |坛友微信交流群
note: dum_in19 omitted because of collinearity
note: dum_in20 omitted because of collinearity
Iteration 0:   log pseudolikelihood = -1398.6116  
Iteration 1:   log pseudolikelihood = -1343.6895  
Iteration 2:   log pseudolikelihood = -1343.2777  
Iteration 3:   log pseudolikelihood = -1343.2769  
Iteration 4:   log pseudolikelihood = -1343.2769  

Probit regression                                 Number of obs   =       2033
                                                  Wald chi2(20)   =     103.78
                                                  Prob > chi2     =     0.0000
Log pseudolikelihood = -1343.2769                 Pseudo R2       =     0.0396

------------------------------------------------------------------------------
             |               Robust
       pin_d |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          IM |   .0349286   .0152563     2.29   0.022     .0050268    .0648305
          EX |  -.0012979   .0094316    -0.14   0.891    -.0197835    .0171878
     dum_in1 |   .3935336   .2281809     1.72   0.085    -.0536927    .8407599
     dum_in2 |  -.1814786   .1931936    -0.94   0.348    -.5601311    .1971739
     dum_in3 |  -.8520875   .2908348    -2.93   0.003    -1.422113   -.2820617
     dum_in4 |  -.3617536   .3291265    -1.10   0.272     -1.00683    .2833224
     dum_in5 |    -.30975    .371427    -0.83   0.404    -1.037734    .4182336
     dum_in6 |    .023996   .2554818     0.09   0.925    -.4767391    .5247311
     dum_in7 |  -.7105277   .2728539    -2.60   0.009    -1.245312   -.1757438
     dum_in8 |   -.814368   .4685178    -1.74   0.082    -1.732646      .10391
     dum_in9 |   .6191057    .159261     3.89   0.000     .3069599    .9312515
    dum_in10 |  -.1450727   .1555843    -0.93   0.351    -.4500123    .1598668
    dum_in11 |  -.8040283   .2403151    -3.35   0.001    -1.275037   -.3330194
    dum_in12 |  -.0513121   .1577078    -0.33   0.745    -.3604136    .2577895
    dum_in13 |  -.4206497   .1749261    -2.40   0.016    -.7634986   -.0778008
    dum_in14 |   .1663208   .1108897     1.50   0.134     -.051019    .3836606
    dum_in15 |   .3416866   .3147164     1.09   0.278    -.2751462    .9585193
    dum_in16 |  -.0610019   .1786916    -0.34   0.733     -.411231    .2892272
    dum_in17 |   .1709796   .1179171     1.45   0.147    -.0601337    .4020929
    dum_in18 |   .7371363   .1860433     3.96   0.000     .3724982    1.101774
    dum_in19 |  (omitted)
    dum_in20 |  (omitted)
       _cons |  -.4243642   .2272548    -1.87   0.062    -.8697753     .021047
------------------------------------------------------------------------------

.设置 行业21 为基组.  回归结果中 自动删除共线的行业19 行业20 虚拟变量 . 基础不好 也不知道该怎么办~~搞得自己很郁闷的说.

使用道具

板凳
han1234567 发表于 2011-9-23 08:33:45 |只看作者 |坛友微信交流群
note: dum_in20 omitted because of collinearity
note: dum_in21 omitted because of collinearity
Iteration 0:   log pseudolikelihood = -1398.6116  
Iteration 1:   log pseudolikelihood = -1343.6895  
Iteration 2:   log pseudolikelihood = -1343.2777  
Iteration 3:   log pseudolikelihood = -1343.2769  
Iteration 4:   log pseudolikelihood = -1343.2769  

Probit regression                                 Number of obs   =       2033
                                                  Wald chi2(20)   =     103.78
                                                  Prob > chi2     =     0.0000
Log pseudolikelihood = -1343.2769                 Pseudo R2       =     0.0396

------------------------------------------------------------------------------
             |               Robust
       pin_d |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          IM |   .0311916   .0143081     2.18   0.029     .0031483    .0592348
          EX |   -.091106   .0454971    -2.00   0.045    -.1802787   -.0019334
     dum_in2 |   1.078482    .710958     1.52   0.129    -.3149699    2.471934
     dum_in3 |  -.4968943   .3425986    -1.45   0.147    -1.168375    .1745866
     dum_in4 |  -.1457143   .3649781    -0.40   0.690    -.8610581    .5696296
     dum_in5 |   -.575388   .3103894    -1.85   0.064     -1.18374    .0329639
     dum_in6 |    2.73976   1.532796     1.79   0.074    -.2644648    5.743984
     dum_in7 |   1.734472   1.405297     1.23   0.217    -1.019861    4.488804
     dum_in8 |   .7420026   .8277599     0.90   0.370     -.880377    2.364382
     dum_in9 |   1.186823   .4467537     2.66   0.008     .3112016    2.062444
    dum_in10 |   .3757353   .3958568     0.95   0.343    -.4001299      1.1516
    dum_in11 |  -.2984878   .3593642    -0.83   0.406    -1.002829     .405853
    dum_in12 |   1.041101   .6935215     1.50   0.133    -.3181764    2.400378
    dum_in13 |   .3855754   .4840658     0.80   0.426     -.563176    1.334327
    dum_in14 |    1.31457   .6990983     1.88   0.060    -.0556377    2.684777
    dum_in15 |   1.388521   .6540812     2.12   0.034     .1065451    2.670496
    dum_in16 |   .2419258   .2665698     0.91   0.364    -.2805414     .764393
    dum_in17 |   1.571164   .8130696     1.93   0.053    -.0224234    3.164751
    dum_in18 |   1.861136   .7207002     2.58   0.010     .4485895    3.273682
    dum_in19 |   1.564181   .9069524     1.72   0.085     -.213413    3.341775
    dum_in20 |  (omitted)
    dum_in21 |  (omitted)
       _cons |   -.041686   .1289653    -0.32   0.747    -.2944532    .2110813
------------------------------------------------------------------------------

. 将行业1 为基组时   ( 因变量是firm-level 变量. 自变量是industry-level 的进出口竞争, 所以我想加入行业变量来控制 fixed industry effect)

使用道具

报纸
han1234567 发表于 2011-9-23 08:43:07 |只看作者 |坛友微信交流群

note: dum_in19 omitted because of collinearity
note: dum_in20 omitted because of collinearity
note: dum_in21 omitted because of collinearity
Iteration 0:   log pseudolikelihood = -1398.6116  
Iteration 1:   log pseudolikelihood = -1343.6895  
Iteration 2:   log pseudolikelihood = -1343.2777  
Iteration 3:   log pseudolikelihood = -1343.2769  
Iteration 4:   log pseudolikelihood = -1343.2769  

Probit regression                                 Number of obs   =       2033
                                                  Wald chi2(20)   =     103.78
                                                  Prob > chi2     =     0.0000
Log pseudolikelihood = -1343.2769                 Pseudo R2       =     0.0396

------------------------------------------------------------------------------
             |               Robust
       pin_d |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          IM |   .0349286   .0152563     2.29   0.022     .0050268    .0648305
          EX |  -.0012979   .0094316    -0.14   0.891    -.0197835    .0171878
     dum_in1 |   .3935336   .2281809     1.72   0.085    -.0536927    .8407599
     dum_in2 |  -.1814786   .1931936    -0.94   0.348    -.5601311    .1971739
     dum_in3 |  -.8520875   .2908348    -2.93   0.003    -1.422113   -.2820617
     dum_in4 |  -.3617536   .3291265    -1.10   0.272     -1.00683    .2833224
     dum_in5 |    -.30975    .371427    -0.83   0.404    -1.037734    .4182336
     dum_in6 |    .023996   .2554818     0.09   0.925    -.4767391    .5247311
     dum_in7 |  -.7105277   .2728539    -2.60   0.009    -1.245312   -.1757438
     dum_in8 |   -.814368   .4685178    -1.74   0.082    -1.732646      .10391
     dum_in9 |   .6191057    .159261     3.89   0.000     .3069599    .9312515
    dum_in10 |  -.1450727   .1555843    -0.93   0.351    -.4500123    .1598668
    dum_in11 |  -.8040283   .2403151    -3.35   0.001    -1.275037   -.3330194
    dum_in12 |  -.0513121   .1577078    -0.33   0.745    -.3604136    .2577895
    dum_in13 |  -.4206497   .1749261    -2.40   0.016    -.7634986   -.0778008
    dum_in14 |   .1663208   .1108897     1.50   0.134     -.051019    .3836606
    dum_in15 |   .3416866   .3147164     1.09   0.278    -.2751462    .9585193
    dum_in16 |  -.0610019   .1786916    -0.34   0.733     -.411231    .2892272
    dum_in17 |   .1709796   .1179171     1.45   0.147    -.0601337    .4020929
    dum_in18 |   .7371363   .1860433     3.96   0.000     .3724982    1.101774
    dum_in19 |  (omitted)
    dum_in20 |  (omitted)
    dum_in21 |  (omitted)
       _cons |  -.4243642   .2272548    -1.87   0.062    -.8697753     .021047
------------------------------------------------------------------------------

.
这个结果是设置21个行业虚拟变量, 并保留截距,  stata 自动删除三个行业虚拟变量 的结果.

使用道具

地板
han1234567 发表于 2011-9-23 18:55:29 |只看作者 |坛友微信交流群
自己顶起来

使用道具

7
蓝色 发表于 2011-9-23 18:59:21 |只看作者 |坛友微信交流群
probit  模型比较复杂
他的虚拟变量与  线性回归的好像是不同的


线性回归换参照组应该也是一样的

使用道具

8
水心依晨 发表于 2011-9-24 10:25:53 |只看作者 |坛友微信交流群
我最近也在处理,如何设定行业虚拟变量进行控制呀,还有如何设定市场化程度变量?谢谢!

使用道具

9
han1234567 发表于 2011-9-25 14:04:48 |只看作者 |坛友微信交流群
水心依晨 发表于 2011-9-24 10:25
我最近也在处理,如何设定行业虚拟变量进行控制呀,还有如何设定市场化程度变量?谢谢!
有N 个行业  就设N-1 个行业虚拟变量,但是貌似 stata自动删除共线性的虚拟变量.  

使用道具

10
strat 发表于 2011-10-15 17:23:57 |只看作者 |坛友微信交流群
设置21个虚拟变量后,每一个虚拟变量都作为一个变量,并与其它自变量和控制变量一起进行回归分析吗?不懂,能麻烦如何在软件中具体操作?
宠辱不惊,闲看庭前花开花落;去留无意,漫随天外云卷云舒.

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-6 03:48