[Stata初级班] 求教连老师，关于缺省值 [推广有奖]

0关注
4粉丝

VIP

已卖：5081份资源

博士生

38%

还不是VIP/贵宾

威望: 0 级
论坛币: 10034 个
通用积分: 22.8832
学术水平: 21 点
热心指数: 26 点
信用等级: 19 点
经验: 3133 点
帖子: 164
精华: 0
在线时间: 170 小时
注册时间: 2007-11-4
最后登录: 2019-5-18

楼主

yellowriver 发表于 2010-2-3 17:08:49 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

我又来麻烦连老师了，这次的问题是关于缺省值的处理，您在视频中提到drop if x1==.| x2==. 但这个是把有某些项缺省值的被调查者的所有其他记录都删除，可是我不想这样，因为，比如A同学，虽然没有填X3,Y2, Y3,但是Y1, ,X6, X7都填了，我还是希望在考虑Y1和X6,X7关系的时候，可以将A同学纳入其中，而在涉及他没填的X3,Y2,Y3与其他变量时，忽略这名A同学。希望stata也能像spss那样exclude missing value。以下是我的变量介绍：

我做一个关于教育投资回报的论文，是个让湖北部分高校毕业生填的调查问卷，样本为700多。
Y1: 大学毕业第1年收入       缺省值30/700 （就是按您所教，输入codebook Y1, Y2, Y3, X3, X6, X7....得到的缺省数目的显示)
Y2: 第3年收入    缺省值45/700
Y3: 第5年收入    缺省值78/700

X3:父母学历    缺省值22/700
X6：大学的级别缺省值29/700
X7:大学的专业  缺省值 21/700

我最后选择多元logit回归做这篇论文，感谢老师关于logit回归的笔记，我遐想着是不是可以在多元logit回归后面，即命令mlogit wage occ educ major tiers, 后面加一个忽略missing value的选项？或者用一个一劳永逸的命令来忽略missing value,就是无论用什么模型（logit regression, OLS, panel data, time series....whatever), 都可以忽略掉缺省值对结果的影响。我觉得我样本缺省值不多，在10%以内吧。

感谢连老师！！！！！！！！！！！！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：连老师缺省值 Time Series panel data regression 老师求教缺省值

本帖被以下文库推荐

· stata matlab python实战|主题: 240, 订阅: 69
· stata软件常见问题|主题: 377, 订阅: 180

沙发

yellowriver 发表于 2010-2-3 17:17:28

补充一下，我的样本是随机样本，听论坛上讨论说随机样本缺省就让它缺省，不要管它，更不要给它们自己赋上什么值，保持样本本来面目就行。可是我就是想忽略掉，画图的时候也不要画出来。
1# yellowriver

藤椅

arlionn

发表于 2010-2-3 20:06:04

这个问题无需处理，stata会自动帮你处理。

对应于你的样本：
Y1: 第1年收入    缺省值30/700
Y2: 第3年收入    缺省值45/700
Y3: 第5年收入    缺省值78/700
X3:父母学历    缺省值22/700
X6：大学的级别缺省值29/700
X7:大学的专业    缺省值 21/700

如果你用 y1 对 x3 回归，则stata会判断二者公共的缺省值，这些样本不会包含在回归中。

输入如下命令可以检验这个问题：
count if y1==. | x3==.  // 假设这里呈现的结果是 35
那么，如下回归命令执行后将使用 700-35=665 个样本：
reg y1 x3
也就是说stata会自动根据你设定的变量来确定缺漏值的个数，这些缺漏值会自动被排除在回归分析之外。