楼主: 有福有德
25578 14

[学习资料] SPSS缺失值分析 [推广有奖]

教师

院士

6%

还不是VIP/贵宾

-

威望
4
论坛币
56500 个
通用积分
8.4735
学术水平
344 点
热心指数
203 点
信用等级
274 点
经验
37400 点
帖子
1138
精华
10
在线时间
945 小时
注册时间
2010-10-14
最后登录
2024-3-21

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

使用SPSS的进行缺失值填补的一般流程:

步骤1:缺失值描述这是基本的过程,分析人员需要对数据有总体的考量,像缺失比例(过大不宜填补)、缺失值分布(单调情况)、什么类型的缺失值等等。

111.png

步骤2:一般来说,侦察变量间是否存在相关关系是必要的,缺失值分析是利用相关变量对缺失值进行填补,如OLS估计中回归模型的填补、ML估计中变量间的相关信息(amos)等。这些过程可以利用软件的统计过程加以确定,也可以直接解读缺失值分析过程里的一些选项,像缺失值的t检验。缺失值分析中通常需要变量间存在相关关系,这也是分析的基础。

222.png

步骤3:变量间的相关关系,有可能是线性的,也可能是非线性的。那么变量间的线性关系可以通过散点图描述。通常来看,线性的关系建议使用回归模型填补、非线性的使用EM的方法填补。

333.png

如果SPSS用户希望获得多重插补的结果。

可以使用多重归因过程,提供MCMC(缺失比例过大或能利用的完整数据比较少,该方法结果往往无法收敛)和单调两种填补的方法,也可以贝叶斯的方法(amos)。当然这个过程中的单调性检查也是必要的。参见:https://bbs.pinggu.org/thread-2349878-1-1.html

444.png

至于多重插补数据集结果分析的方法有:

不同数据集的筛选或者综合利用完整数据信息。

1)根据模型拟合度的优劣筛选数据。

  例如:建立不同组的模型,比较模型优度指标R方。

2)根据项目判断更适合项目需求或实际意义的数据集。

  例如:主要检查变量的显著性,看哪个结果更符合实际情况。

3)利用完整信息获得相关统计量

例如:可以计算联合标准误,spss针对多重归因的数据会有相应过程默认处理。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:SPSS PSS 缺失值 thread pinggu 单调性 散点图 用户

已有 3 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
菇凉凉水水 + 5 + 1 + 1 + 1 精彩帖子
zhuishan + 1 + 1 + 1 观点有启发
casboryy + 5

总评分: 论坛币 + 5  学术水平 + 7  热心指数 + 2  信用等级 + 2   查看全部评分

本帖被以下文库推荐

所有模型都是错的
沙发
eightdays 发表于 2013-4-17 20:30:00 |只看作者 |坛友微信交流群
好帖!顶

使用道具

藤椅
mssr 发表于 2013-4-17 20:51:22 |只看作者 |坛友微信交流群
an interesting missing values analysis example

使用道具

板凳
水上人间 发表于 2013-4-20 21:53:22 |只看作者 |坛友微信交流群
好贴。支持福德老师。

使用道具

报纸
mssr 发表于 2013-4-20 23:08:05 |只看作者 |坛友微信交流群
very useful post

使用道具

地板
╰☆Fascinate 发表于 2013-5-18 17:08:59 |只看作者 |坛友微信交流群
学习了

使用道具

7
charles_zsm 发表于 2013-8-14 19:00:11 |只看作者 |坛友微信交流群
学习了

使用道具

8
城管的惊叹 发表于 2013-8-27 16:21:19 |只看作者 |坛友微信交流群
学习了,顶一个!

使用道具

9
zhuishan 发表于 2013-10-3 23:26:56 |只看作者 |坛友微信交流群
{:soso_e163:}{:soso_e163:}{:soso_e163:}

使用道具

10
yyb624 发表于 2014-3-11 22:23:15 |只看作者 |坛友微信交流群
帖子不在于长,击中要点就好。不过,还是想知道两个问题:1)是如何检验缺失模式属于MCAR呢?2)多重数据集出来之后如何选择哪个数据集是最理想的。作为量表分析,在项目水平上的多重插补还是直接在总分上进行比较好?期待进一步指教。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 07:51