随便翻开一本统计学课本,我们会看到这样的定义:
p值是在假定原假设为真时,得到与样本相同或者更极端的结果的概率。
你的反应多半会是:「说人话!」
好好好,那咱们来举个例子:假设明天就要宿舍卫生检查了,可同住一屋的蓝精灵和格格巫都不想搞卫生,在一番谦(si)让(bi)之后,格格巫掏出一块看起来很无辜的钢蹦儿,提议这事儿交给老天爷决定:正面蓝精灵做,反面他做。被格格巫坑过或试图坑过不止一次的蓝精灵心想,这钢蹦儿会不会不太对劲,抛出来正反面的可能性不一样大?于是蓝精灵拿到钢蹦儿,跑到墙角自己先抛了五遍,结果傻眼了——五遍都是正面!格格巫的阴谋就这样再一次被挫败了……
这事儿跟p值有半毛钱关系吗?
有!
回到刚才你读过的定义上,咱们来细想一下,蓝精灵同学如果学过统计学的话会是怎么考虑的。
首先,本着疑罪从无的原则,善良的蓝精灵假定格格巫的钢蹦儿是均匀的,也就是抛出来正面和反面的概率都是0.5。这就是定义里的「原假设」。
而蓝精灵的「样本」是,抛5次钢蹦儿,得到了5个正面。由于只抛了5次,不可能得到比5次更多的正面了,因此在这个例子里不存在比样本「更极端的结果」。
那么,什么是「与样本相同」的结果?这取决于蓝精灵是否对这枚钢蹦儿偏向某一边有特定的假设。蓝精灵想起,格格巫提出的办法是如果反面就由他搞卫生,那就应该没有钢蹦儿偏向反面的可能性。所以他认为,要是这块钢蹦儿不均匀,就只可能偏向正面。在这种情况下,「与样本相同的结果」就只有5次正面这一种。
所以,如果钢蹦儿是均匀的,连抛5次得到都是正面的概率就是0.5的5次方,也就是0.03125,这就是我们所说的p值。换句话说,这种结果得玩儿32次才会出现1次。即使不做这样的计算,蓝精灵从日常生活的经验中,也能感觉到,对于一块均匀的钢蹦来说,得到这样的结果实在不太可能了。与其相信这样的小概率事件真的发生了,我们觉得更合理的解释是这块钢蹦儿根本就不是均匀的。多小的p值算是小?在统计学中,最常用的界线是0.05,因为这个样本对应的p值小于0.05,所以蓝精灵拒绝了原假设,也就是人们常说的「具有统计学意义上的显著性」,认为格格巫拿出了一块偏向正面的钢蹦儿。
好了,现在我们再念一遍p值的定义:
p值是在假定原假设为真时,得到与样本相同或者更极端的结果的概率。
是不是更像一点儿人话了?
|