请选择 进入手机版 | 继续访问电脑版
楼主: gavinsanzo
12799 18

[问答] 求助一个关于均值置信区间的问题 [分享]

  • 0关注
  • 0粉丝

小学生

64%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
1 点
热心指数
0 点
信用等级
0 点
经验
55 点
帖子
7
精华
0
在线时间
6 小时
注册时间
2011-2-8
最后登录
2016-6-2

gavinsanzo 发表于 2011-5-3 20:57:55 |显示全部楼层
通常我们计算均值置信区间都是利用t分布来计算的。

但是在SPSS的 “描述”“探索”这一项功能,他计算均值置信空间的前提,是不是这组被测试的数据他要是服从正态分布的?

我有一组数据,他的 Frequency distribution 如下图
112.jpg



这不是一个正态分布吧。
那么对于这组样本数据,我要怎么去确定他的均值置信区域,然后这个置信区域又能够代表总体的情况呢?


真心求解。谢谢各位达人。
关键词:置信区间 distribution Frequency 正态分布 Ency 求助 均值 置信区间

回帖推荐

耕耘使者 发表于2楼  查看完整内容

是的,要求服务正态分布,可以用SPSS进行正态性检验。 但中心极限定理表明,即使不服从正态分布,但只要样本足够大,其均值也近似服从正态分布。 大样本的规定是,一般是30,社会统计学要求50。 一句话,只要是大样本,我们都可以进行区间估计。
已有 1 人评分学术水平 收起 理由
耕耘使者 + 1 鼓励积极发帖讨论

总评分: 学术水平 + 1   查看全部评分

本帖被以下文库推荐

stata SPSS
耕耘使者 发表于 2011-5-3 21:57:52 |显示全部楼层
是的,要求服务正态分布,可以用SPSS进行正态性检验。
但中心极限定理表明,即使不服从正态分布,但只要样本足够大,其均值也近似服从正态分布。
大样本的规定是,一般是30,社会统计学要求50。
一句话,只要是大样本,我们都可以进行区间估计。
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

回复

使用道具 举报

gavinsanzo 发表于 2011-5-3 22:09:20 |显示全部楼层
谢谢啊~~~问题是。我用SPSS做非线性KS检测后,就只有第一组数据符合正太分布,其他都不适合,所以我目前也就只算了第一组数据的均值置信区域,那其他几组,我应该怎么去确定他的置信区域呢。而且这个确定了的置信区域,可以说明总体的特征值么???
对了。这几组数据属于不同的实验,互不干涉。
111.jpg
112.jpg
121.jpg
122.jpg
124.jpg
131.jpg


你看吧。除了第一个,其他的都不符合任何经验分布。。。。。。
可以直接用那个 描述统计- 探索 的功能直接把他的均值置信区域算出来,然后就说总体的均值置信区域就是这样的么?
回复

使用道具 举报

gavinsanzo 发表于 2011-5-3 22:36:04 |显示全部楼层
2楼的大哥。。你该不会只是为了友情挽尊,消灭0回复吧。。。
回复

使用道具 举报

耕耘使者 发表于 2011-5-3 22:47:22 |显示全部楼层
我说了,要大样本,利用中心极限理。
则样本均值服从正态分布。你不信,我也没办法。
回复

使用道具 举报

cjblovebj 发表于 2011-5-3 23:09:55 |显示全部楼层
这明显不是正态分布嘛!但为什么非得要个置信区间呢?那你可以试试做个数据变换~~~ 1# gavinsanzo
尽最大努力,做最坏打算!
回复

使用道具 举报

gavinsanzo 发表于 2011-5-3 23:32:50 |显示全部楼层
耕耘使者 发表于 2011-5-3 22:47
我说了,要大样本,利用中心极限理。
则样本均值服从正态分布。你不信,我也没办法。
厄。不要动怒。。我不是不信。我是求教。。。在spss里面怎么利用中心极限定理来搞。
而且第二个样本有5324个数据,不算小了吧。
但是具体操作应该怎么弄呢。
然后如果他的均值符合正太分布,那么是不是在把他的均值作为新的数组来用 描述统计 得知他的均值的置信空间呢?
回复

使用道具 举报

gavinsanzo 发表于 2011-5-3 23:37:20 |显示全部楼层
cjblovebj 发表于 2011-5-3 23:09
这明显不是正态分布嘛!但为什么非得要个置信区间呢?那你可以试试做个数据变换~~~ 1# gavinsanzo
因为我最后要得出的结论是这组数据他最后的均值区间是多少。
这么说吧。一组数据里面的每个数代表了一个方框里面的点的数目。比如说第一个图里面有135组数据,每一组数据里面都有a个点,a的值是不一样的。
第二图是5324组数据。每个图都是一个单独的实验,互不影响。
我最后就是想知道,每个图里面。那些点在方框里面的密度是多少。方框的大小为一个单位,所以他的均值置信区域就可以反映出他的密度了。

但是问题是这些图都只是样本,如果一组数据他不符合一个理论分布,那么他的特征值可以代表总体的特征值么。

哎。我也不知道自己是不是表达清楚了。
回复

使用道具 举报

耕耘使者 发表于 2011-5-4 13:46:14 |显示全部楼层
gavinsanzo 发表于 2011-5-3 23:32
耕耘使者 发表于 2011-5-3 22:47
我说了,要大样本,利用中心极限理。
则样本均值服从正态分布。你不信,我也没办法。
厄。不要动怒。。我不是不信。我是求教。。。在spss里面怎么利用中心极限定理来搞
而且第二个样本有5324个数据,不算小了吧。
但是具体操作应该怎么弄呢。
然后如果他的均值符合正太分布,那么是不是在把他的均值作为新的数组来用 描述统计 得知他的均值的置信空间呢?
大样本和中心极限定理,是要你在心里明白的,至于SPSS操作,你已经会了,就是用explore命令,所得出的区间就是你所要的。
回复

使用道具 举报

耕耘使者 发表于 2011-5-4 13:49:13 |显示全部楼层
cjblovebj 发表于 2011-5-3 23:09
这明显不是正态分布嘛!但为什么非得要个置信区间呢?那你可以试试做个数据变换~~~ 1# gavinsanzo
这是一个误导。区间估计要利用的样本均值服从或近似服从正态分布,而不是说一定要样本数据本身服从。
样本数据xi和样本均值x-bar 是不同的概念,它们都是随机变量。
中心极限定理明确表示,不管总体是不是正态分布,只要大样本,则其样本均值都趋于正态分布。
一句话:要紧的是样本均值的分布,而不是总体的分布。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2021-1-23 22:24