我在课堂上经常会提下面的几个问题:
问题1、一个家庭有两个孩子,问都是女孩的概率是多少?
答:1/4
问题2、一个家庭有两个孩子,已知其中有一个是女孩,问另一个也是女孩的概率是多少?
我每次问这个问题,学生的回答几乎都是1/2。于是我就会问一个类似却又不同的另一个问题:
问题3、一个家庭有两个孩子,已知大的孩子是女孩,问小的孩子也是女孩的概率是多少?
这个问题的正确答案是1/2。
于是,马上就会有人开始认真地审视问题2与问题3之间的区别了。
同样是问这个家庭的两个孩子都是女孩的概率,问题1因为没有告诉你更多额外的信息,因此答案就是1/4,但问题2和问题3却附加了一些信息或条件,因此概率就发生了变化而不再是1/4。
问题2与问题3的条件看上去很相似,但其实是不一样的。问题2只是告诉你,这个家庭的两个孩子不全是男孩,于是便有三种可能:姐弟、兄妹、姐妹,而姐妹只是其中的一种,于是问题2的答案应该是1/3。而问题3的条件将这个家庭限制在只有两种可能:姐弟和姐妹,答案自然就是1/2。
一般将试验所有可能的结果组成的集合称为样本空间,记为S。如果关于试验的结果你得到了一些信息,那么在此信息下,试验的所有结果就会发生变化。变化后的样本空间有时称之为缩减的样本空间。
比如问题1的样本空间有四个元素,但问题2和问题3的样本空间则被缩减为只包含3和2个元素了。这种在缩减的样本空间中计算的概率就是条件概率。
我们在第一篇文中提到的马晓春那段话中的概率(51%)就是一个条件概率——在前面两盘比赛的结果已经是一比一平的条件下他能获得世界冠军的条件概率。
条件概率是在已有的信息或条件下对事件发生概率的一个调整。从概率的直观意义出发,若事件A已经发生,则要使事件B发生当且仅当试验的结果既属于B又属于A,即属于AB,因此P(B|A)应为P(AB)在P(A)中的“比重”.由此,我们给出条件概率P(B|A)的定义.
P(B|A)=P(AB)/P(A)
其中P(B |A)就是事件A发生的条件下事件B发生的条件概率。
关于条件概率,也可以引出很多有趣的讨论。
(待续)