我又来麻烦连老师了,这次的问题是关于缺省值的处理,您在视频中提到drop if x1==.| x2==. 但这个是把有某些项缺省值的被调查者的所有其他记录都删除,可是我不想这样,因为,比如A同学,虽然没有填X3,Y2, Y3,但是Y1, ,X6, X7都填了,我还是希望在考虑Y1和X6,X7关系的时候,可以将A同学纳入其中,而在涉及他没填的X3,Y2,Y3与其他变量时,忽略这名A同学。希望stata也能像spss那样exclude missing value。以下是我的变量介绍:
我做一个关于教育投资回报的论文,是个让湖北部分高校毕业生填的调查问卷,样本为700多。
Y1: 大学毕业第1年收入 缺省值30/700 (就是按您所教,输入codebook Y1, Y2, Y3, X3, X6, X7....得到的缺省数目的显示)
Y2: 第3年收入 缺省值45/700
Y3: 第5年收入 缺省值78/700
X3:父母学历 缺省值22/700
X6:大学的级别 缺省值29/700
X7:大学的专业 缺省值 21/700
我最后选择多元logit回归做这篇论文,感谢老师关于logit回归的笔记,我遐想着是不是可以在多元logit回归后面,即命令mlogit wage occ educ major tiers, 后面加一个忽略missing value的选项?或者用一个一劳永逸的命令来忽略missing value,就是无论用什么模型(logit regression, OLS, panel data, time series....whatever), 都可以忽略掉缺省值对结果的影响。我觉得我样本缺省值不多,在10%以内吧。
感谢连老师!!!!!!!!!!!!


雷达卡




京公网安备 11010802022788号







