请选择 进入手机版 | 继续访问电脑版
楼主: 胖胖小龟宝
16699 54

[学科前沿] 【从零开始学统计】7.这个P不简单   [推广有奖]

大师

21%

还不是VIP/贵宾

-

TA的文库  其他...

龟宝的档案室

威望
3
论坛币
793110 个
通用积分
21961.1155
学术水平
2211 点
热心指数
2133 点
信用等级
1424 点
经验
978860 点
帖子
10001
精华
25
在线时间
4757 小时
注册时间
2012-7-27
最后登录
2020-12-21

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
哈哈,楼主此次的标题起得有点粗俗,这个P当然不是屁,而是指软件中那个常常出现的P值。不管有没有学过统计,相信很多同学(包括楼主)在刚开始接触P值时,对它的理解多少有点云里雾里的,以至于在做模型检验的时候往往只关注P值是否小于α,到底拒不拒绝原假设这个问题。但细细想来,却真没对它有过深入了解(当然现在也不怎么深入……)所以,借着做这个系列的空,又把书翻出来看看,去网上找了一些资料,大致理了下思路,算是普及一下概念,希望大牛能够及时点评,加以指导,楼主万分感谢!

Q:简单点说什么是P值?
A:P值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。

举个例子:比如,在100次硬币投掷实验中,观察到出现90次正面,10次反面(Q)。怎么样的事件才是“极端的”?简单地说,一个事件很极端,那么少比它本身“更极端”的事件就非常少(比如,只有“91次正面,9次反面”、“91次反面,9次正面”等情况才比它更极端)。

但这个Q只是从一次实验中得出的。我们可以重复做这个实验,比如100次,每次都投掷100次,记录下的正面数X,它构成一个二项分布,X~B(n,p),其中,n=100,p=0.5。根据某个中心极限定理,正态分布是二项分布的极限分布,上面的二项分布可以由均值为np=50,方差为np(1-p)=25的正态分布来近似。我们在这个近似的正态分布的两端来考察所谓“更极端”的事件,那就是正面数大于90或者小于10。

重复一遍,“P值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率”。如果P值很小,就表明,在原假设为真的情况下出现的那个分布里面,只有很小的部分,比出现的这个事件(比如,Q)更为极端。没多少事件比Q更极端,那就很有把握说原假设不对了。

在上述近似的正态分布中,P值就等于X>90 或 X<10的概率值(记做,P{X>90 or X<10})。根据对称性,这个概率值等于2*P{X<10}=1.2442E-15。

上面我们的确求出了一个非常小的P值,但如何不含糊地确定它就是很“极端”呢? 事先确定的显著性水平α,本身就是一个判定法则。只要P值小于显著性水平α,我们就认为,在认为原假设为真的情况下出现的事件Q,是如此地极端,以至于我们不再相信原假设本身。一句话,我们的判定法则是:P值小于显著性水平α,拒绝原假设。
具体说来:
      P值                碰巧出现的概率                  对原假设               统计意义
   P>0.05    碰巧出现的可能性大于5%   不能否定原假设   两组差别无显著意义
   P<0.05    碰巧出现的可能性小于5%   可以否定原假设   两组差别有显著意义
   P <0.01   碰巧出现的可能性小于1%   可以否定原假设   两者差别有非常显著意义

理解P值,下述几点必须注意:
    ⑴P的意义不表示两组差别的大小,P反映两组差别有无统计学意义,并不表示差别大小。比如拿药效做例子,与对照组相比,C药取得P<0.05,D药取得P <0.01并不表示D的药效比C强。
    ⑵若取α=0.05,当P>0.05时,差异无显著意义,根据统计学原理可知,不能拒绝原假设,但并不认为原假设肯定成立(一般也可以说是不拒绝原假设,切记,不拒绝≠接受);当P<0.05时,有显著差异,拒绝原假设。
    ⑶显著性检验只是统计结论。判断差别还要根据专业知识。样所得的样本,其统计量会与总体参数有所不同,这可能是由于两种原因。

Q:如何计算P值?
A:若非考试,一般统计软件都会自带P值;若要手工算,那么——
用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值。
左侧检验 H0:μ≥μ0 vs H1:μ<μ0
P值是当μ=μ0时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = P(Z≤ZC|μ=μ0)
右侧检验 H0:μ≤μ0 vs H1:μ>μ0
P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = P(Z≥ZC|μ=μ0)
双侧检验 H0:μ=μ0 vs H1:μ≠μ0
P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = 2P(Z≥|ZC||μ=μ0)

20080803_1c3d7fd09b8fceea6f14zuQwnJKUxzuf.jpg

Q:所有的检验统计都是正态分布的吗?
A:并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、F检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:从零开始 中心极限定理 正态分布 二项分布 实际问题 统计学 检验 P值 P值意义

已有 7 人评分经验 威望 论坛币 学术水平 热心指数 信用等级 收起 理由
moretc + 20 + 20 + 3 + 4 + 2 精彩帖子
日新少年 + 1 + 1 + 1 精彩帖子
katty0521 + 1 + 1 + 1 精彩帖子
太阳出城 + 1 + 1 精彩帖子
chenyi112982 + 100 + 3 + 3 偶很喜欢这个系列,点赞
reduce_fat + 100 鼓励积极发帖讨论
admin + 1 精彩帖子

总评分: 经验 + 220  威望 + 1  论坛币 + 20  学术水平 + 9  热心指数 + 10  信用等级 + 4   查看全部评分

本帖被以下文库推荐

ilovestata 发表于 2014-5-21 10:19:28 |显示全部楼层 |坛友微信交流群
这个P不简单

使用道具

free_dom 发表于 2014-5-21 12:46:27 来自手机 |显示全部楼层 |坛友微信交流群
胖胖小龟宝 发表于 2014-5-21 09:33
哈哈,楼主此次的标题起得有点粗俗,这个P当然不是屁,而是指软件中那个常常出现的P值。不管有没有学过统计 ...
当初能想出p的人更不简单啊!

使用道具

焉沫殇情 发表于 2014-5-21 15:37:47 |显示全部楼层 |坛友微信交流群
额   楼主辛苦了。。。。

使用道具

larry_dh 发表于 2014-5-21 19:58:13 |显示全部楼层 |坛友微信交流群
真棒,最晚刚看假设检验 顶一个

使用道具

学习了

使用道具

yuerqieqie 发表于 2014-5-21 23:13:18 |显示全部楼层 |坛友微信交流群
强re“不拒绝≠接受

关于pvalue的解释最近几年争论的很厉害啊。今年nature上有一篇比较容易理解的关于pvalue的文章(Regina Nuzzo, Scientific method: Statistical errors - P values, the 'gold standard' of statistical validity, are not as reliable as many scientists assume. http://www.nature.com/news/scien ... ical-errors-1.14700

使用道具

harleych 发表于 2014-5-22 03:24:30 |显示全部楼层 |坛友微信交流群
统计之都网站有两个文章讲P值,我也是看了这篇文章才彻底弄明白。
http://cos.name/2008/12/p-value-notes/
http://cos.name/2008/12/p-value/

使用道具

ahterry 发表于 2014-5-22 05:25:15 |显示全部楼层 |坛友微信交流群
真棒,最晚刚看假设检验 顶一个

使用道具

yeh77 发表于 2014-5-22 07:43:10 |显示全部楼层 |坛友微信交流群
学习了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-17 04:05