|
感谢楼主,以下是心得,说错请指正:
第一,所谓控制行业和年份就是reg y x i.industry i.year,或者xtreg y x i.year, fe,或者reghdfe y x, absorb(industry, year)
第二,每组中只要有完全不随时间变动的量(最典型的,group id,对时间的mean、变异系数这类),fe估计一定会omitted,事实上这些东西影响的是个体效应,被计入group这个层次的固定效应中去了。至于reghdfe,把非时变的变量放在absorb外则会omitted,放absorb中则跟absorb group id没任何区别,因为此时完全非时变变量无非是groupid的另一个等价表述,也就是。目前想到的办法,只能随机效应、haussman-taylor、动态面板。
第三,至于民族、受教育程度、性别在组内是非时变的,一般是模型搞错了。连老师在讲解refhdfe时复制了一篇AER的论文,控制了三个FE,这才是正确的思路。体会如下:(1)要控制或者absorb的变量间一定不要是线性相关的,否则会产生第二点中说的问题;(2)要控制或者absorb的变量尽量要离散一些,否则样本中观测值不够用。
|