楼主: liuyu0103
22449 8

行业控制,哑变量生成 [推广有奖]

  • 0关注
  • 0粉丝

高中生

7%

还不是VIP/贵宾

-

威望
0
论坛币
9 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
272 点
帖子
17
精华
0
在线时间
22 小时
注册时间
2011-11-2
最后登录
2025-2-6

楼主
liuyu0103 发表于 2012-2-21 16:39:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
总共有21个行业分类,我要在回归中控制行业影响,听说可以通过设置哑变量来完成,不知道如何做,或者还有没有别的方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:变量生成 哑变量 行业影响 行业分类 不知道 行业 行业分类 影响

沙发
sungmoo 发表于 2012-2-21 19:50:57
ta industry,g(ind)

藤椅
h3327156 发表于 2012-2-21 22:07:04
似乎有三种作法:

第一种,如楼上sungmoo大大说的
ta industry,g(ind)
【这时您可以得到各行业的哑变量,一共21个,分别为ind1 ind2 ind3........一直到ind21】
【这个方法好处是,您可以自由选择基准组,其它方法并不是说不行,只是感觉比较麻烦】

第二种与第三种方法,都是书中或手册说的factor variable

  第二种即
  假设您做简单线性回归,被解释变量是y
  xi: reg y i.industry
  【第二种方法,您会发现除基准组变量外,会有_Iindustry_2  _Iindustry_3  _Iindustry_4 ......
     一直到_Iindustry_21】
  【这个方法依然有著除基准组哑变量外,其它的哑变量】
  【缺点是可能有matsize太小的问题】

   第三种即
   reg y i.industry
   【这个方法的缺点是在您的变量里并不会有各行业的哑变量出现,但优点是,不会像第二种方法,有时会出现matsize太小的问题】

参考看看吧! 祝福您~
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
aolei + 1 + 1 + 1 观点有启发

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

板凳
aolei 发表于 2012-2-21 22:14:13
h3327156 发表于 2012-2-21 22:07
似乎有三种作法:

第一种,如楼上sungmoo大大说的
第三种不太懂,请问能否再解释下?

报纸
h3327156 发表于 2012-2-21 23:36:48
aolei 发表于 2012-2-21 22:14
第三种不太懂,请问能否再解释下?
根据测试的结果,发现第二种与第三种,当哑变量很多很多时,都会面临matsize的问题。
Stata对模型的解释变量初步有限制啦! 除非您去更改set matsize

对于第三种的缺点是对的,但优点我认为我说错了! 测试的结果发现它也是会出现matsize太小的讯息。

*以下是测试的例子
set seed 12345
set obs 400
drawnorm u1
gen x1=uniform()
gen y1=0.7*x1+u1
gen xx=_n

xi: reg y1 x1 i.xx
reg y1 x1 i.xx

地板
childqq 在职认证  发表于 2012-2-27 11:22:18
sungmoo 真是高手

7
蓝色 发表于 2012-2-27 12:00:15
h3327156 发表于 2012-2-21 22:07
似乎有三种作法:

第一种,如楼上sungmoo大大说的
Stata12中的基准组很容易选择
. reg c f i.firm

      Source |       SS       df       MS              Number of obs =     100
-------------+------------------------------           F(  5,    94) =   12.60
       Model |  5483419.36     5  1096683.87           Prob > F      =  0.0000
    Residual |  8183642.78    94  87060.0296           R-squared     =  0.4012
-------------+------------------------------           Adj R-squared =  0.3694
       Total |  13667062.1    99  138051.133           Root MSE      =  295.06

------------------------------------------------------------------------------
           c |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
           f |   .2442211   .0629874     3.88   0.000     .1191583     .369284
             |
        firm |
          2  |     361.93     247.57     1.46   0.147     -129.626     853.486
          3  |   336.0289   177.2457     1.90   0.061    -15.89656    687.9544
          4  |   331.7711   248.8716     1.33   0.186    -162.3692    825.9115
          5  |   228.2752   175.6152     1.30   0.197     -120.413    576.9634
             |
       _cons |  -409.9815   280.8374    -1.46   0.148    -967.5909    147.6278
------------------------------------------------------------------------------

. reg c f ib4.firm

      Source |       SS       df       MS              Number of obs =     100
-------------+------------------------------           F(  5,    94) =   12.60
       Model |  5483419.36     5  1096683.87           Prob > F      =  0.0000
    Residual |  8183642.78    94  87060.0296           R-squared     =  0.4012
-------------+------------------------------           Adj R-squared =  0.3694
       Total |  13667062.1    99  138051.133           Root MSE      =  295.06

------------------------------------------------------------------------------
           c |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
           f |   .2442211   .0629874     3.88   0.000     .1191583     .369284
             |
        firm |
          1  |  -331.7711   248.8716    -1.33   0.186    -825.9115    162.3692
          2  |   30.15887   93.31654     0.32   0.747    -155.1233     215.441
          3  |   4.257812   122.9195     0.03   0.972    -239.8018    248.3175
          5  |  -103.4959   124.1787    -0.83   0.407    -350.0557    143.0639
             |
       _cons |   -78.2104   78.35057    -1.00   0.321    -233.7773    77.35649
------------------------------------------------------------------------------


.

8
liuyu0103 发表于 2012-2-29 21:53:45
谢谢大家我,我搞懂这个问题了,好像xi i.year挺好用的

9
昨日山僧来9 发表于 2016-8-11 20:04:46
h3327156 发表于 2012-2-21 22:07
似乎有三种作法:

第一种,如楼上sungmoo大大说的
写的很清楚,但是如果是面板数据固定效应呢?应该怎么控制

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-9 17:35