虽然用了很多遍的stata,但是说实话基础知识没有很扎实,所以来询问。
我之前处理数据的时候,是把关键变量(比如自变量、因变量)的缺失值都删掉,至于控制变量(比如性别、年龄),因为只缺失几个,所以我当时的处理方法就是直接把这些变量也都删掉。
但是现在在处理chns数据,发现其中有一个控制变量,性别,一旦删掉它的缺失,样本量将减少2/3,于是我有所顾虑。如果将这一变量的缺失值删掉,整个人群的结构都将发生变化,比如之前的已婚率是65%,现在就将变成53%,感觉这样的处理个人干预过多,使得数据失真;但如果不删除这些缺失,我不知道跑回归的时候stata是怎么来处理这些缺失的,以及这些缺失会对结果造成什么影响吗?


雷达卡







京公网安备 11010802022788号







