楼主: liqingzhao104
14641 5

[其他] 数据不符合正态分布剔除变量值 [推广有奖]

  • 0关注
  • 0粉丝

小学生

71%

还不是VIP/贵宾

-

威望
0
论坛币
906 个
通用积分
2.1626
学术水平
3 点
热心指数
3 点
信用等级
3 点
经验
404 点
帖子
9
精华
0
在线时间
8 小时
注册时间
2012-2-28
最后登录
2013-3-10

楼主
liqingzhao104 发表于 2012-2-29 13:16:17 |AI写论文
5论坛币
曾经在一篇发表过的论文中看到数据的前期筛选剔除了一些变量的1%异常值,我做类似的研究,但是发现那些数据不符合正态分布,不知道不符合正态分布的情况下剔除变量1%异常值是否合适?剔除超过3倍标准差的数据可以吗?或有什么更好的方法找出异常值或极端值吗?如果有,请详细给出方法,我用spss的,专门为了剔除异常值到stata版学习了,对stata还不是很熟,希望各位高手帮忙给出详细的方法,谢谢!

补充:我的样本4000多个,在做分析时是不是不用考虑非正态分布的影响?

关键词:正态分布 剔除变量 变量值 Stata 非正态分布 正态分布 标准差 论文 样本 影响

沙发
aibieli731001 发表于 2012-2-29 13:19:47
采用数据拟合试试。

藤椅
liqingzhao104 发表于 2012-2-29 13:25:08
aibieli731001 发表于 2012-2-29 13:19
采用数据拟合试试。
数据拟合是什么?怎么操作呢?能说详细点吗?

板凳
江子 发表于 2012-3-6 19:18:48
我也是在做一组数据的正态分布性检验,用了对数转换和BOX-COX转换,结果sig值都小于0.05不符合正态分布,我的数据是土壤采样数据,大约2000个点左右
我很纳闷怎么会出现这种情况,数据我已经用三倍标准差处理过了,为什么还是不符合正态分布

报纸
蓝色 发表于 2012-3-6 21:30:04
性别变量、教育程度变量、职业变量等也不是正态分布,难道也要删除

地板
sungmoo 发表于 2012-3-6 21:42:48
OLS的经典假定是:y|x~N(x'β,σ^2)

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-21 23:32