前些日子看见朋友询问有关缺失值的处理方法,以下内容就是在网上搜索得出的答案,希望能够为你带来帮助:
对于缺失值的处理
在数据整理中,经常会碰到缺失值的问题,缺失值的数量过多的话,说明数据收集过程中存在着严重的问题。可以接受的标准是,缺失值的数量在10%以下。处理缺失值的方法有下面4种:
(1)用一个样本统计量的值代替缺失值
缺失值可以使用一个样本的统计量去代替,最典型的做法就是使用该变量的样本平均值。由于该变量的平均值保持不变,其他的统计量如标准差、相关系数等都不会受到影响。如在收入或者年龄问题中出现缺失值,可以使用收入、年龄的平均值代替缺失值。
(2)用从一个统计模型计算出来的值去代替缺失值
另一种缺失值的处理方法就是利用由某些统计模型计算得到的比较合理的值代替,常使用的模型有回归模型、判别模型等等。如“个人收入”、“ 年龄”与“品牌的选择”可能存在关系,利用这三个问题的被访者问答数据,可能构造出一个回归方程。根据这个回归方程,对于没有回答“品牌选择”的被访者,可以根据“个人收入”和“年龄”的选项,利用回归方程式,计算出品牌选择的值。
(3)将有缺失值的个案删除
将有缺失值的个鞍删除的方法,结果可能会导致样本量的减少,如果调查在收集过程中控制得不是很好,被访对象多多少少都会出现一些问题没有回答的情况,删除个案的方法,会导致大量的样本减少。
(4)将有缺失值的个案保留,仅在相应的分析中做必要的删除
将有缺失值的个案保留,仅在相应的分析中做必要的排除的方法,会使分析中不同计算的样本量不同,也有可能导致不适宜的结果。调查的样本量比较大,缺失值的数量又不是很多,而且变量之间也不存在高度的相关的情况下,市场研究者经常采用这种方式处理缺失值。
关于SPSS的教程,我几乎把人大网上的教程下了一遍,有些楼主的确很让人失望。花了很多的币,评价好的教程确寥寥无几。
在此,顺便附上由百度提供的SPSS12教程的地址。http://zhibao.swu.edu.cn/epcl/spss/spss.htm 感觉挺不错的在线教材,希望大家喜欢。如果有更好的,希望大家留个言,与大家分享。