我以Greene的书作为参考,加上我自己的理解给你解释。
首先要搞清楚的是固定效应(FE)和随机相应(RE)的本质区别在于E(Ci | Xi)=constant与否, 其中Ci表示的是Individual Effects. 如果不作区分,在估计FE和RE模型的时候会产生一些问题。FE的假设比较符合现实,但由于假设太弱又会具有一些问题。而RE的假设太强了,不符合现实。所以才有处于假设强度中间位置的Munlak和Chamblein的方法,Chamblein的假设又比Munlak要弱一些。根据Greene的书,我们大致知道有以下几种估计方式(不知道怎么在论坛打数学符号,所以我用文字叙述。建议看原版书):
1、Pooled Regression Model,也就是相当于假设所有数据来自同一个总体。不管是取自哪个个体或者哪个时间。这个时候如果对FE模型用OLS估计,会产生endogeneity,所以对FE是不合适的。但是可以对RE用OLS估计,但分析error term我们可以知道,RE模型具有autocorrelation,所以我们可以采取OLS+robust covariance matrix的形式。(endogeneity & autocorrelation的产生都是由E(Ci | Xi)=constant与否的不同情况)
2、出于同样的考虑,我们可以把数据根据个体的不同看作不同的clusters,对模型进行一点转化,采用Group means+ robust covariance matrix、first difference或者deviations (within, between, total)对模型进行估计。这些方法全都适用于RE。但由于E(Ci | Xi)不为constant,Group means的方法不适用于FE,会导致无法识别的问题。
3、如第9楼所说,对FE我们可以写成LSDV的形式进行估计(LSDV相当于把individual effects提了出来放在估计式中,从而不会有endogeneity)。由于数据量太大,我们通常采用Partial Regression的方式。但是需要注意的是RE也可以采用LSDV的形式利用Partial Regression的方式进行估计。
4、对RE,由于具有autocorrelation,所以我们采用GLS或者WLS。这两者需要假设covariance matrix已知。如果covariance matrix未知,我们可以采用FGLS和FWLS,F means feasible.