楼主: cdcwangyan
1271 2

[文彤老师SPSS课程] 数据缺失值分析问题 [推广有奖]

  • 1关注
  • 0粉丝

小学生

35%

还不是VIP/贵宾

-

威望
0
论坛币
2008 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
46 点
帖子
4
精华
0
在线时间
5 小时
注册时间
2009-8-19
最后登录
2017-1-20

cdcwangyan 发表于 2013-4-26 11:54:17 |显示全部楼层
本帖最后由 cdcwangyan 于 2013-4-26 11:55 编辑

张老师:
       现由基层单位报上来数据7000多条,需要对其分析。但发现用logistic回归分析的5个重要变量,不是这缺就是那缺,而主要是两个连续性变量的数据缺失,5个变量全有的数据仅4000条。我现在考虑有三个方法:1.只用完整数据,对其logistic回归分析,2.经过little检验,用EM法对缺失数据填补,再用Logistic回归分析。3.对7000条数据的某些变量进行单因素分析,再对完整数据进行Logistic 回归分析。想问你的问题:1.三种办法选择哪种好?2.如果仅对完整数据分析,专家问起来缺失的问题,如何解释回答才好?不是完全随机分析,怎么代表7000条的真实结果(7000条也不是随机抽的,只是按要求体检结果抽出来报送的),谢谢!

stata SPSS
张文彤 在职认证  发表于 2013-4-27 13:29:56 |显示全部楼层
先用单因素方法做预筛,明显无关的就不用再考虑了。
可以做EM的缺失值填补,但是要小心,最好是填补前后的数据都进行建模,看结果是否有很大差异。
对缺失值出现原因的定性分析非常重要。
回复

使用道具 举报

servus 发表于 2013-5-3 11:58:42 |显示全部楼层
看看能发帖没
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-9-19 01:13