我用STATA跑了一个logistic回归,因变量为CEO的晋升情况,自变量为CEO的个人特征和公司特征。如果不加固定效应直接回归的话,样本量大概在5200左右(已经删除了所有存在缺失值的样本)。代码是:logistic Y X1 X2 X3 X4 X5 X6
但是加入年份和行业的固定效应后,样本量就减少为4600左右,代码是:
logisticY X1 X2 X3 X4 X5 X6 i.year i.ind
而如果在此基础上再加入省份的固定效应,样本量就下降为了2900个。代码:
logisticY X1 X2 X3 X4 X5 X6 i.year i.ind i.area
但是year, ind, area这三个变量都是没有缺失值的,所以不太清楚为什么会出现样本缺失的情况。
求教各位!