楼主: yujiannan
31507 14

[学习资料] spss怎样剔除异常值? [推广有奖]

11
随心所钰 发表于 2012-7-25 16:09:50 |只看作者 |坛友微信交流群
在analyse中选descriptive statistics ——explore ——将normality plots with test选中,将三个标准差以外的数据剔除

使用道具

12
shenwenqin 发表于 2012-9-2 00:03:30 |只看作者 |坛友微信交流群
xiexie

使用道具

13
铁锷未残 学生认证  发表于 2012-9-17 11:05:47 |只看作者 |坛友微信交流群
快乐在心 发表于 2010-10-27 10:30
先做正态分布检验。如果是正态分布,则用平均数加/减三个标准差处理;如果是偏态分布,则用“五数分布法”。 ...
能说的详细些吗?
世界上没有谁优不优秀,逼到绝路谁都卓越;有了退路,谁都平庸;世界上有条很长很美的路叫做梦想,还有堵很高很硬的墙叫现实;翻越那堵墙,叫做坚持;推倒那堵墙,叫做突破。

使用道具

14
铁锷未残 学生认证  发表于 2013-4-9 20:41:25 |只看作者 |坛友微信交流群
快乐在心 发表于 2010-10-27 10:30
先做正态分布检验。如果是正态分布,则用平均数加/减三个标准差处理;如果是偏态分布,则用“五数分布法”。 ...
在实际操作中,不存在教科书上严格界定的正态分布,只可能存在近似的正态分布,那么这个近似的正态分布的标准是什么呢?
世界上没有谁优不优秀,逼到绝路谁都卓越;有了退路,谁都平庸;世界上有条很长很美的路叫做梦想,还有堵很高很硬的墙叫现实;翻越那堵墙,叫做坚持;推倒那堵墙,叫做突破。

使用道具

15
matlab-007 发表于 2015-6-30 22:54:16 |只看作者 |坛友微信交流群
我常用一下方法:
1、可以通过“分析”下“描述统计“下“频率”的”绘制“直方图”,看图发现频数出现最少的值,就可能是异常值,但还要看距离其它情况的程度。

2、可通过“分析”下的“描述统计”下的“探索”下的“绘制”选项的“叶茎图”,看个案偏离箱体边缘(上端、下端)的距离是箱体的几倍,“○”代表在1.5-3倍之间(离群点),“*”代表超过3倍(极端离群点)。

3、可以通过“分析”下“描述统计“下“描述”下的选项“将标准化存为变量Z”,选择相应的变量,“确定”。将生成新变量,如果值超过2,肯定是异常值。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 10:10