楼主: 胖胖小龟宝
25889 39

[学科前沿] 【从零开始学统计】3.置信度置信的到底是什么? [分享]

助理

大师

21%

还不是VIP/贵宾

-

TA的文库  其他...

龟宝的档案室

威望
3
论坛币
792771 个
通用积分
20277.7877
学术水平
2181 点
热心指数
2099 点
信用等级
1399 点
经验
892672 点
帖子
10026
精华
25
在线时间
4721 小时
注册时间
2012-7-27
最后登录
2019-9-2

胖胖小龟宝 发表于 2014-5-9 14:33:32 |显示全部楼层
前两期楼主分别作了均值和拟合优度的专题,今天就来说说置信度。

要说置信度,首先老师肯定会在此前已经介绍过了点估计了,那么引入这个概念的目的自然是为了配合一个叫做区间估计,估算置信区间。通常都是用点估计(点估计一般就是用概率论导出的一个估计值)算出来的数据加上一个变动幅度形成一个区间。在这个变动幅度里,涉及到一个参数就是置信度。

  • 首先我们要问为什么要用区间估计?

咱来看个例子:你打枪打10次,你可以得到一个平均值,比如是8.那么我问你,总体的期望是不是就是8呢?你要说是,那就太草率了吧,因为你再打10次可能就是7了,那么总体的期望就变成7了嘛?当然不是,总体的期望是客观存在不会变的。实际上均值等于期望的概率是0啊,所以说,以点估点是不准确的。但是既然样本是从总体中抽出来的,那么样本的均值和总体的期望应该差的不远吧?你射击的均值是8,总体的期望总不能是1吧?所以,你若换句话说打枪的平均环数是[6,8],那么相信的人就会很多了。可见,虽然扩大了总体均值的取值范围,但是可信度明显高了。

当然你不能简单无限度扩大区间范围,毕竟统计也要讲究一定的精度。所以咱就有了置信度,也就是说,你测得的均值,和总体真实情况的差距小于这个给定的值的概率,说你测得的均值就是总体期望是很草率的,但是说,我有95%的把握认为我测得的均值,非常接近总体的期望了,听起来就靠谱的多。

  • 平时我们常说的95%置信度到底是什么意思呢?

要理解置信度,就要理解好置信区间。要理解置信区间,就要从统计学最基本最核心的思想去思考,那就是用样本估计总体。在统计学中,非常容易把概念模糊化,很容易把95%置信区间理解成为在这个区间内有95%的概率包含真值。
但是这里有两个容易混淆的地方
1.真值指得是样本参数还是总体参数?这个问题的答案是总体参数,我们取的数据是样本数据,点估计是样本参数的真实值,我们要估计总体参数。
2.95%的概率,变动的是谁?这里95%的概率,变动的是置信区间


错误理解:假如有100个考生,100个学生中有95个考分落在(70,80)这个区间内。这就是95%置信度。
这是非常错误的理解,样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值,这个值只有一个,且不会变动。
那正确的应该怎么理解呢?
样本数目不变的情况下,做一百次试验,有95个置信区间包含了总体真值。置信度为95%。换言之,若扩大样本容量,考100次试,这100名学生的成绩组成改的区间有95次包含了总体真正的均值,那这才是95%置信度。说白了,我们有95%的把握说总体的真值在这个区间内。

  • 那么还有一个问题,是不是置信度越高越好?

这个问题就要看你需要统计的是什么?经济效益是什么?通常情况下,95%被作为常用的置信度,原理就在于3西格玛控制(在一些严格的领域甚至会用到6西格玛),此时已经有很高的置信度了,那在往上去,随着置信度的上升,置信区间的跨度也就越大,对参数估计的精度必定降低。点估计就一个值,精度高,但置信度则低,精度与置信度相互的取舍则要全由分析者自行选择了。

楼主tips:置信度这个问题,其实核心问题就是要理解我们的核心思想是用样本估计总体,保证的是总体参数的精确度,这个区间是为总体设计的即可。


补充一张图片 liuxigema.gif




































关键词:从零开始 置信度 是什么意思 置信区间 区间估计 置信度 置信区间 统计

已有 3 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
lzsxy2009 + 5 精彩帖子
crystal8832 + 36 + 2 + 2 精彩帖子
日新少年 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 41  学术水平 + 3  热心指数 + 3  信用等级 + 1   查看全部评分

本帖被以下文库推荐

stata SPSS
afu_ty 发表于 2014-5-9 14:40:34 来自手机 |显示全部楼层
胖胖小龟宝 发表于 2014-5-9 14:33
前两期楼主分别作了均值和拟合优度的专题,今天就来说说置信度。

要说置信度,首先老师肯定会在此前已经 ...
学习!
回复

使用道具 举报

zhouguobin 在职认证  发表于 2014-5-9 14:57:20 |显示全部楼层
作为学统计的我,来顶一下
不会编程的分析师不是好quant,不会宏观的程序员不是好基金经理
回复

使用道具 举报

胖胖小龟宝 发表于 2014-5-9 15:33:40 |显示全部楼层
zhouguobin 发表于 2014-5-9 14:57
作为学统计的我,来顶一下
谢谢支持
回复

使用道具 举报

free_dom 发表于 2014-5-9 20:03:48 来自手机 |显示全部楼层
胖胖小龟宝 发表于 2014-5-9 14:33
前两期楼主分别作了均值和拟合优度的专题,今天就来说说置信度。

要说置信度,首先老师肯定会在此前已经 ...
谢谢楼主分享
回复

使用道具 举报

cara9 发表于 2014-5-12 16:26:25 |显示全部楼层
支持一下下~
回复

使用道具 举报

jingsuan2014 学生认证  发表于 2014-5-12 17:06:17 |显示全部楼层
学习了
回复

使用道具 举报

xq1457 发表于 2014-5-12 23:41:48 |显示全部楼层
一如既往的关注和支持,楼主辛苦了
回复

使用道具 举报

qaz2216 发表于 2014-5-21 16:09:29 |显示全部楼层
学习学习
回复

使用道具 举报

stream 发表于 2014-5-21 20:39:42 |显示全部楼层
吹毛求疵一下:
1)“点估计一般就是用概率论导出的一个估计值”,这个是什么意思啊?
2)“容易把95%置信区间错误理解成为在这个区间内有95%的概率包含真值;应该是我们有95%的把握说总体的真值在这个区间内。”后一句也就是说有5%的把握真值不在这个区间。可是,我真的不理解,这个区间包含真值的概率是95%,这两种意思有冲突吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-12-7 00:45