楼主: fangjie-fanglu
37620 14

[问答] 为什么样本量很大,但还是不满足正态分布呢? [推广有奖]

  • 0关注
  • 1粉丝

已卖:19份资源

本科生

48%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
0.0057
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1637 点
帖子
60
精华
0
在线时间
96 小时
注册时间
2009-5-20
最后登录
2022-3-17

楼主
fangjie-fanglu 发表于 2011-6-29 11:02:38 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一般情况下,我们都认为大样本时的分布接近正态分布,但是我的样本很大(10000人),数据经过清洗,处理了缺失值和极端值,在正态性检验中却检验为正偏态,而不是正态或者接近正态,造成这种现象的可能原因是什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:正态分布 样本量 正态性检验 缺失值 极端值 正态分布 样本量

回帖推荐

--墨子-- 发表于15楼  查看完整内容

首先 样本量很大的时候根据中心极限定理,趋于正态的是抽样分布(Sampling Distribution),而不是样本分布(Sample's distribution) 其次,非正态分布会不会产生影响取决于你的模型,不是所有的模型都会收到非正态性的影响(很多模型在非正态性下仍然很稳健)

本帖被以下文库推荐

沙发
kuangsir6 发表于 2011-6-29 11:28:11
fangjie-fanglu 发表于 2011-6-29 11:02
一般情况下,我们都认为大样本时的分布接近正态分布,但是我的样本很大(10000人),数据经过清洗,处理了缺失值和极端值,在正态性检验中却检验为正偏态,而不是正态或者接近正态,造成这种现象的可能原因是什么?
没有你这个说法的!
正确的说法是这样的(中心极限定理):
样本是从总体中随机抽选出来的,只要样本容量足够大,所有样本的平均值就以总体的平均值为中心呈现正态分布。

藤椅
myloveisyuepan 发表于 2011-6-29 11:36:11
是随机抽取的吗?
自强不息,厚德载物。修好这颗心。

板凳
fangjie-fanglu 发表于 2011-6-29 16:56:09
是方便取样

报纸
fangjie-fanglu 发表于 2011-6-29 17:06:11
很多统计方法都是以数据的正态分布为前提条件,因此,在使用这些统计方法前,要对数据进行正态性检验,以检验是否符合该统计方法的前提条件。但是,数据的样本量达到10000人,数据的正态性检验却不是正态分布,导致下一步的统计分析难以进行,这让人十分尴尬。请问各位大虾,此时应该怎么办呢?是否不必管正态性检验的结果而直接使用以正态分布为前提的统计检验呢?

地板
黑鹰眼 发表于 2011-6-29 18:10:21
哎……不是正态分布那就采用非参数检验啊,一般社会科学的采样受非控制因素影响较大,不符合正态分布是常有的事。

7
spss19 发表于 2011-6-29 19:13:25
因為樣本數為10000人,幾乎任何檢定都會顯著,因此,不能直接看正態檢定的結果。此時,可以配合Q-Q圖或是P-P圖來判斷。

8
yiyijiayuan 发表于 2011-7-4 08:29:39
因为它们来自不同的总体。
个人论坛https://spssluntan.webboard.org/
https://spssluntan.mybb.online/

9
chyshl 发表于 2011-7-4 18:58:04
样本量大就正态分布?貌似没必然联系吧?

10
perfect-秋 发表于 2011-7-5 15:05:21
那是不是这个变量的总体就不是正态分布呢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 04:12