楼主: wmcheng2006
12448 8

[学习分享] 缺失值的处理方法(1)传统方法 [推广有奖]

  • 2关注
  • 10粉丝

硕士生

33%

还不是VIP/贵宾

-

威望
0
论坛币
502 个
通用积分
6.0613
学术水平
19 点
热心指数
13 点
信用等级
8 点
经验
2925 点
帖子
131
精华
0
在线时间
139 小时
注册时间
2007-4-27
最后登录
2019-3-24

楼主
wmcheng2006 发表于 2012-5-21 21:23:11 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

缺失值处理的传统方法

列删法 将存在缺失值的被试删除。列删法操作方便,仍目前流行的缺失值处理方法(Peugh & Enders, 2004)。列删法的假设机制是MCAR,在很多情况下很难满足此假设,所以会产生偏差的参数估计(e.g., Enders & Bandalos, 2001)。由于删除了非缺失信息,损失了样本量,进而削弱了统计功效。但是,当样本量很大而缺失值所占样本比例较少时(<5%)可以考虑使用列删法,但任然存在上述不足。

对删法 在计算相关矩阵时,用所有可获得的数据计算,不管是否存在缺失值。同列删法一样,对删法的假设机制也是MCAR,在不满足假设时产生估计偏差(e.g., Enders & Bandalos, 2001)。由于计算每对相关系数基于差异较大的样本,所以存在协方差矩阵非正定的风险(Graham, 2009)。另外,样本的差异也会使计算标准误产生问题(Enders, 2010; Graham, 2009)。

均值替代法Mean Substitution)使用每个变量的均值去填补该变量的缺失值。这种方法产生估计偏差(Little & Rubin, 1987),最不为方法学者推荐(Allison, 2003; Enders, 2006, 2010; Graham, 2009)

回归法 (Regression Imputation) 根据变量间的相关,利用其他变量的信息通过建立回归方式去推算缺失值。该法同样会产生估计偏差(Enders, 2006, 2010)

相似反应类型插补法(Similar Response Pattern Imputation) LISREL处理缺失值的一种方法。通过从有类似反应模式的个体得分中获得一个数值填补缺失值。如果完整数据找不到类似反应则不能完成插补,在MCAR下产生无偏的参数估计,在MAR下产生偏差估计但偏差要不列删法和对删法要小(Enders & Bandalos, 2001)

平均同质项目法 假设个体在某一因子的某些条目上存在缺失值,通过平均其他几个条目得分来填补缺失值。这种做法在实际中很常见,但缺陷也很明显(Schafer & Graham, 2002)。

获得更多信息可以参见:
http://www.hneap.com/a/EAPanli/kechengxinxi/2012/0516/201.html

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:处理方法 缺失值 Enders 缺失值处理 参数估计 传统 计算 amp 正定

Mplus学习分享http://blog.sina.com.cn/u/2142257021

沙发
jialin3105 发表于 2012-5-22 00:25:08
其中有的方法几乎无用,譬如第一个,列删除,如果删除了没准删除变量等,就不太好用。使用之前,需要测试一下你的缺失值是不是完全随机的,用spss即可,如果是missing completely at random,那么就用什么方法都可以了,如果不行,用老师的话,就是go home and cry,哈哈
成长的快乐

藤椅
wmcheng2006 发表于 2012-5-22 12:49:44
jialin3105 发表于 2012-5-22 00:25
其中有的方法几乎无用,譬如第一个,列删除,如果删除了没准删除变量等,就不太好用。使用之前,需要测试一 ...
这些都是传统方法,已很少用了。现代的方法比如MI,FIML等受到关注。
Mplus学习分享http://blog.sina.com.cn/u/2142257021

板凳
jialin3105 发表于 2012-5-23 08:30:49
wmcheng2006 发表于 2012-5-22 12:49
这些都是传统方法,已很少用了。现代的方法比如MI,FIML等受到关注。
其实我倒是觉得方法没有新旧,主要是选择适合你用的,不管是新方法还是旧方法,肯定要选择适用你的数据的,研究领域的等等
成长的快乐

报纸
wmcheng2006 发表于 2012-5-23 21:35:34
jialin3105 发表于 2012-5-23 08:30
其实我倒是觉得方法没有新旧,主要是选择适合你用的,不管是新方法还是旧方法,肯定要选择适用你的数据的 ...
道理是对的,方法为问题服务,但是往往忽视了方法可以开拓视野。但传统的缺失值处理方法存在估计偏差,所以随着新的方法引入已经很少使用了。如果现在还使用传统方法的话,reviewer会要求你重新分析数据的。
Mplus学习分享http://blog.sina.com.cn/u/2142257021

地板
jiangbogz 发表于 2012-10-9 09:11:37
楼主好贴!
看庭前花开花落;
望天上云卷云舒。

7
biostat 发表于 2012-10-11 09:09:12
数据质量非常重要,再怎么补救都是没办法,肯定会影响结论

8
史蒂芬肥青年 发表于 2016-6-25 16:01:38
楼主有 缺失值的处理方法(2)或者(3)吗?链接打不开啊!!

9
dieguyouren 发表于 2017-10-24 22:11:04
你好,看了好多缺失值填补方法,我想请教下量表缺失值用哪种方法处理比较好呢?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 19:14