楼主: keepvigil
53201 25

[一般统计问题] 回归分析的时候需要让所有变量都不存在缺失值吗? [推广有奖]

  • 0关注
  • 1粉丝

已卖:6份资源

博士生

84%

还不是VIP/贵宾

-

威望
0
论坛币
2618 个
通用积分
5.2798
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
89 点
帖子
113
精华
0
在线时间
332 小时
注册时间
2013-11-21
最后登录
2020-1-5

楼主
keepvigil 发表于 2014-10-30 21:46:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
       虽然用了很多遍的stata,但是说实话基础知识没有很扎实,所以来询问。
       我之前处理数据的时候,是把关键变量(比如自变量、因变量)的缺失值都删掉,至于控制变量(比如性别、年龄),因为只缺失几个,所以我当时的处理方法就是直接把这些变量也都删掉。
      但是现在在处理chns数据,发现其中有一个控制变量,性别,一旦删掉它的缺失,样本量将减少2/3,于是我有所顾虑。如果将这一变量的缺失值删掉,整个人群的结构都将发生变化,比如之前的已婚率是65%,现在就将变成53%,感觉这样的处理个人干预过多,使得数据失真;但如果不删除这些缺失,我不知道跑回归的时候stata是怎么来处理这些缺失的,以及这些缺失会对结果造成什么影响吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:回归分析 缺失值 不存在 CHNS数据 Stata 回归分析

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
日新少年 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

沙发
ermutuxia 发表于 2014-11-7 16:01:39
如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了,因为回归的时候用的是所有变量都不缺失的观测值
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 + 1 热心帮助其他会员

总评分: 论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

藤椅
keepvigil 发表于 2014-11-11 23:41:53
ermutuxia 发表于 2014-11-7 16:01
如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了,因为回归的时候用的是所有变量都不缺失 ...
啊谢谢您~我后来问了老师,老师的意思跟您是一样的。

不过我的考虑是这样:我想分离出来两个群体A和B,然后就人群特征做一分析,以及这两人群的收入差异做以一分析。考虑到人群特征,我就不敢对数据进行大处理,特别是删掉很多缺失。不过后来我选择了其他年份后发现缺失没有特别严重。但有一项是受教育程度,大概有20个的缺失,样本总量是300+。我看了版上的一些贴,说是可以用SPSS做一个缺省值分析,判断他到底是随机丢失还是其他,然后根据情况再对缺失值进行处理。我在这里采取了这种方式~不知道有没有问题?

板凳
礼蕊昂 发表于 2014-11-12 01:37:49
关于你这个问题,我好像在一本书上看到过,有种办法就是填充缺失值,例如你说的这个男女比例,你先统计没缺失值的,然后根据统计的男女比例去填充缺失值。我是菜鸟,只大概记得这种办法,希望能帮助你。
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
hustchen2012 + 12 + 12 + 2 + 3 + 1 精彩帖子

总评分: 经验 + 12  论坛币 + 12  学术水平 + 2  热心指数 + 3  信用等级 + 1   查看全部评分

报纸
礼蕊昂 发表于 2014-11-12 01:39:30
你还可以不要那个变量,先回归下,然后再取那些没缺失值得回归下,看下这个变量存在是否显著。

地板
keepvigil 发表于 2014-11-12 21:05:36
礼蕊昂 发表于 2014-11-12 01:37
关于你这个问题,我好像在一本书上看到过,有种办法就是填充缺失值,例如你说的这个男女比例,你先统计没缺 ...
好的~超感谢你的~我去试一下~

7
企鹅8217 发表于 2014-11-13 00:09:52
用duplicates drop试试

8
longxia2013 发表于 2014-11-13 00:34:12
好好学一学

9
crystal8832 学生认证  发表于 2014-11-13 12:11:42
其实楼主可以试试,如果你的变量里存在缺失值,那么在回归过程中,包含确实值的那一行是被忽略掉的。
已有 2 人评分经验 学术水平 热心指数 收起 理由
xmulinkun + 1 + 1 精彩帖子
SpencerMeng + 60 + 1 观点有启发

总评分: 经验 + 60  学术水平 + 1  热心指数 + 2   查看全部评分

10
catherinzhao 学生认证  发表于 2015-3-6 22:14:45
缺失值有多少才算多?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-28 17:01