楼主: robustus
11083 6

[问答] [求助]数据缺失怎么处理? [推广有奖]

  • 0关注
  • 0粉丝

大专生

25%

还不是VIP/贵宾

-

威望
0
论坛币
74 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
289 点
帖子
35
精华
0
在线时间
23 小时
注册时间
2007-12-23
最后登录
2012-6-30

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

5点量表,问卷回收时,发现其中一些题目漏填了,这样的样本算是有效的么?会不会影响数据的分析呀?

谢谢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据缺失 怎么处理 数据 缺失

回帖推荐

matlab-007 发表于6楼  查看完整内容

录入的时候可以直接省略不录入 分析的时候也一般剔除这样的样本。但也有替换的方法,一般有: 均值替换法(mean imputation),即用其他个案中该变量观测值的平均数对缺失的数据进行替换,但这种方法会产生有偏估计,所以并不被推崇。 个别替换法(single imputation)通常也被叫做回归替换法(regression imputation),在该个案的其他变量值都是通过回归估计得到的情况下,这种 方法用缺失数据的条件期望值对它进行替换。这虽然是 ...

penguin0606 发表于3楼  查看完整内容

数据缺失属于正常现象,只要通过分析满足不同方法对于正态性或方差齐性等要求即可,在分析时有几种处理方法:1.使用平均值替换缺失值(replace with mean);2.在分析时剔除有缺失值的样本,在分析时选择exclude cases list wise方法,即去除所有含缺失值的个案后再进行分析;3.Exclude cases pairwise只有当一个观测量的全部聚类变量值缺失时才将其从分析中剔除。以上三种方法在option-missing values中选择,不过不同的统计方法可能 ...

本帖被以下文库推荐

沙发
zdm095127 发表于 2008-5-25 19:35:00 |只看作者 |坛友微信交流群

利用数据挖掘系统处理一下就可以了

使用道具

藤椅
penguin0606 发表于 2008-5-25 19:39:00 |只看作者 |坛友微信交流群

数据缺失属于正常现象,只要通过分析满足不同方法对于正态性或方差齐性等要求即可,在分析时有几种处理方法:1.使用平均值替换缺失值(replace with mean);2.在分析时剔除有缺失值的样本,在分析时选择exclude cases list wise方法,即去除所有含缺失值的个案后再进行分析;3.Exclude cases pairwise只有当一个观测量的全部聚类变量值缺失时才将其从分析中剔除。以上三种方法在option-missing values中选择,不过不同的统计方法可能略有区别。请其他坛友补充、改正!

已有 2 人评分经验 论坛币 收起 理由
xiaowenzi22 + 20 热心帮助其他会员
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 23  论坛币 + 3   查看全部评分

使用道具

板凳
robustus 发表于 2008-5-25 21:18:00 |只看作者 |坛友微信交流群

哦,谢谢

那就不算是无效问卷了吧?

使用道具

报纸
spoonshen 发表于 2008-5-25 23:27:00 |只看作者 |坛友微信交流群
如果选择DELETE的话,应该选LISTWISE, 不要用casewise. 也就是当它们是无效的。

选择REPLACEMENT的话, 是当它们是有效的。除了MEAN REPLACEMENT之外还可以用REGRESSION REPLACEMENT.

使用道具

地板
matlab-007 发表于 2015-5-30 08:17:26 |只看作者 |坛友微信交流群
录入的时候可以直接省略不录入
分析的时候也一般剔除这样的样本。但也有替换的方法,一般有:
均值替换法(mean imputation),即用其他个案中该变量观测值的平均数对缺失的数据进行替换,但这种方法会产生有偏估计,所以并不被推崇。
个别替换法(single imputation)通常也被叫做回归替换法(regression imputation),在该个案的其他变量值都是通过回归估计得到的情况下,这种
方法用缺失数据的条件期望值对它进行替换。这虽然是一个无偏估计,但是却倾向于低估标准差和其他未知性质的测量值,而且这一问题会随着缺失信息的增多而变得更加严重。
多重替代法(multiple imputation)(Rubin, 1977) 。
ƒ它从相似情况中或根据后来在可观测的数据上得到的缺省数据的分布情况给每个缺省数据赋予一个模拟值。结合这种方法,研究者可以比较容易地,在不舍弃任何数据的情况下对缺失数据的未知性质进行推断(Little and Rubin,1987; ubin,1987, 1996)。
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

使用道具

7
aycdcjmk 在职认证  发表于 2017-5-18 10:51:44 |只看作者 |坛友微信交流群
学习啦,O(∩_∩)O谢谢

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 08:59