三门问题条件概率与贝叶斯公式
于德浩
2022.2.6
最近,我发现我对贝叶斯公式的理解还不够深刻。就是说,“你写一下贝叶斯公式,并说一下其中的意义;但你并没有很快直接写出来,而需要再去翻看概率论的书籍。”希望,这一次我是彻底弄懂了。
条件概率,是指在A事件发生的前提条件下,B事件发生的概率。从概率面积图中,我们能很容易的看到这个定义,即集合A与B的交集面积除以集合A的面积。P(A∩B)≡P(AB); P(B|A)≡P(AB)/P(A)。这里就有了概率乘法,即P(AB)= P(B|A)*P(A)= P(A|B)*P(B)。
如果Bi是概率空间全集S的一个划分,那么P(A)=ΣP(ABi)=ΣP(A|Bi)*P(Bi),这就是边沿概率或者全概率公式。我们把条件概率定义公式的分子,用概率乘法逆推出来;分母写成全概率公式;就得到了著名的贝叶斯公式,P(Bi|A)≡P(ABi)/P(A)= P(A|Bi)*P(Bi)/ ΣP(A|Bj)*P(Bj)。
一个非常有名的例题,钱袋里摸金币问题,这是我在朱永生老师著作的《实验物理中的概率和统计》看到的。有三个外观相同的钱袋子B1,B2,B3,其中B1里有2枚金币,B2有一金一银,B3有两枚银币。请问,我们随机取一个钱袋,第一次摸出一枚钱币是金币的概率是多少?再进一步问第二个问题,如果第一次是金币,请问剩下的还是金币的概率是多大?
我们先设定,摸到钱袋B1的概率事件为b1,发生概率显然是P(b1)=1/3。同理,P(b2)=P(b3)=1/3。 设定“第一枚钱币是金币的概率事件是a事件”,发生概率是P(a)。
我们根据全概率公式去计算,P(a)=P(a|b1)*P(b1)+P(a|b2) *P(b2)+ P(a|b3) *P(b3)。其中,P(a|b1)的物理意义就是,“当概率事件b1发生时,即若是摸到第一个钱袋B1;第一枚钱币是金币的a事件发生的概率”,由于B1里有2玫金币,所以,摸出来的第一枚钱币一定是金币,即P(a|b1)=1。 同理,我们也能“显然”知道,P(a|b2)=1/2,P(a|b3)=0。
带入上面的已知数据,就得到P(a)=1*1/3+1/2*1/3+0*1/3=1/2。这个结果,我们是可以直观感受到的。这就相当于我们把3金3银,混在一起,随手抓一个,那么第一枚是金币的概率就是其比率3/(3+3)=1/2,这就是另外一种方法的间接验证。
再看第二个问题。 “若第一枚是金币,袋子里还剩下一枚金币”,就等同于摸到的钱袋是B1的概率,即求P(b1|a)。我们代入条件概率的贝叶斯公式,P(b1|a)= P(a|b1)*P(b1)/P(a)=1*1/3/(1/2)=2/3。
这个结果与人们的直观感觉不太一样。“既然第一枚摸到的是金币,就说明一定不是B3;只能是钱袋B1或B2其中一个;而这两个应该是无差别的,所以概率应该是各50%才对。”其实,钱袋B1与B2不是概率平权的,上面的概率计算就是证明。但是,我们直接去争论是很难说服其他人的。人们会说,“两个钱袋是一样的,原来都是1/3概率;当排除第三个后,那就各占一半了。” 而你只能说,“B1是两枚金币,而B2是一金一银,它俩不一样;B1出现的概率至少要更大些。”
另一个更经典的反直觉概率问题就是三门问题。一个当年很火的美国电视节目,有三扇门,只有其中一扇门后面有跑车大奖。当参赛者随机选一扇门,比如门A;主持人会把剩余的一扇空门,比如B门打开;然后问,“你是改选C门,还是坚持你原来的选择A门?” 这是一个条件概率问题,正确的数学计算是,若更改为选择C门,概率就会从原来的1 /3提升为2/3。
很多人凭直觉提出了质疑。“当排除掉B门后,剩余的两扇门应该概率各50%才对。选A或选C,应该是一样的。人们应该相信第一感觉,不要轻易更改。”
有人说,假设有一个人迟到后入场,让他随机选剩余的A或C,他的概率肯定是1/2。难道对于参赛者的概率是1/3和 2/3,对于后者却是1/2和1/2,这不违背概率的客观性吗?
有人说,有两个参赛者,一个选A,一个选C,中间空门B打开。如果更改选择会提升概率,那么到底是A更好,还是C更好呢?这不自相矛盾吗?
有些悖论,我们可能一时看不出其中破绽,但我们只要知道它是错的就行。因为,我们只需知道一种正确解法的结果即可。对于三门问题,最简单的解法如下:参赛者第一次选择A门,显然是1/3的概率可能猜对拿大奖。那么,剩余2个门就是1-1/3=2/3的胜算。如果更改选择选B门,就相当于选了B门和空门,即选了所有剩下的门,那么概率就仍然是2/3。
这个解法是可推广验证的。假设是四门问题,若打开一个空门,那么更改选择之后的概率是从1/4提升到(1-1/4)/(4-1-1)=3/8。若打开两个空门,那么概率就提升至(1-1/4)/(4-1-2)=3/4。若一个空门也不打开,那么概率依然是(1-1/4)/(4-1-0)=1/4,这与一般常识和直觉就是相符的。
其实,从执行策略讲,即使不懂概率计算,也应该更改选择。假设是100个门,第一次随机选一个,主持人把其它98个空门都打开,你显然会去选那个没有被打开的门,即使你不会算出概率是99%。因为,你起码知道你第一次选择仅有1%的胜算,这肯定无法拿大奖;所以必须要更改选择才行。
我之所以重新关注三门问题,是因为我想用条件概率的贝叶斯公式去计算得出。但,没能转化为合适的数学模型。我从手机网上搜索了一篇微信公众号文章,找到了计算方法。我们假设A门后面有跑车大奖是概率事件a,其发生概率是显然的P(a)=1/3。同理,P(b)=P(c)=1/3。参赛者随机选择一个门,不妨设为A门,这是必然事件h。主持人打开一扇空门,不妨设为B门,这是概率事件d。那么我们就要去求解“空门打开后,不更改选择的胜率”P(a|d),及“更改选择的胜率”P(c|d)。
根据贝叶斯公式,P(a|d)=P(d|a)*P(a)/P(d)。根据全概率公式,P(d)= P(d|a)*P(a)+ P(d|b)*P(b)+ P(d|c)*P(c)。条件概率P(d|a) 的物理意义是“当a事件,即A门后有大奖的事件发生时,主持人打开B门的概率“。 显然,这时主持人可以打开B门,也可以开C门,所以这个概率就是P(d|a)=1/2。
条件概率P(d|b) 的物理意义是“当b事件,即B门后有大奖的事件发生时,主持人打开B门的概率“。 这时主持人不能打开B门,所以这个概率就是P(d|b)=0。条件概率P(d|c) 的物理意义是“当c事件,即C门后有大奖的事件发生时,主持人打开B门的概率“。 这时主持人只能打开B门,所以这个概率就是P(d|c)=1。
把上面已知数据代入,就得到“不更改的胜率“P(a|d)=1/2*1/3/(1/2*1/3+0*1/3+1*1/3)=1/3;而”更改后的胜率“P(c|d)=1*1/3/(1/2*1/3+0*1/3+1*1/3)=2/3。通过数学公式得到的结果会更有信服力。
再说一下上面提到的三个质疑悖论的破绽。 一是,有两个可能状态,未必是平权的,你得有足够的证据才行。比方说,掷硬币连续3次是正面为赢,否则为输。你有赢或输两种可能的结果,但显然不是平权的各50%。
三门问题,我们试用一下枚举法。第一,参赛者选A门,A门后有大奖,主持人开B门。若更改选择,那么就是输。第二,A门后有大奖,主持人开C门,若更改选择,那么就是输。第三,B门后有大奖,主持人只能开C门,更改后就是赢。第四,C门后有大奖,主持人只能打开B门,更改后就是赢。 如果认为4种路径是平权的,那么就是胜算为50%;可是,若第一和第二归类为一种状态,那么就是1输2赢,胜算是2/3。 如果你不确定第一和第二能否归类为一种状态,那么枚举法在这里就是失效的,我们要去找更合适的算法。
第二个悖论。概率事件,对于不同的人,不同的信息获取范畴,胜率当然是不一样的。参赛者的更改后胜率为2/3,就是要比迟到者的1/2胜算更高,因为他掌握的信息更多,分析的更正确充分。当然,若他没能正确利用信息,他就只有1/3的胜算。 倘若对于主持人来言,胜算就是100%,因为主持人的信息更全面。
第三个悖论,正确的概率是两人各50%的胜算。但这与三门问题是两码事。这实际是限定了B门必须是空门。 倘若B门后面有大奖,这个游戏就被迫中断了,没有第二次选择的机会了。
我还有必要说明的是,三门问题,虽然更改后的胜率提升为2/3,但未必结果一定能赢。还有,你还要考虑“情感损失”。假如你选A门,没有二次更改,最后你果然没得大奖,你只会觉得“运气不够好,有点可惜。”而假如你选A门,二次更改为C,可最后你竟然没得大奖,你会怎么想?你会懊悔一辈子。“曾经,老天给我一个跑车大奖;可我竟然犯贱,朝令夕改,拱手让出。什么数学计算,什么胜率更高,什么最优策略,统统都没用。
理智不能战胜感性的事太多了。在几百年前,有人坚持日心说真理,可当时的地心说把他给烧死了。股票指数的年收益率平均8%,远高于一般银行理财产品的年2%,可人们都不敢买股票,长期持有。 彩票的胜率是几百万分之一,期望值为负,可仍有大量的人趋之若鹜。人们不和你算数学概率,“百万富翁的梦想是要有的,万一真实现了呢?两块钱一张彩票,这么便宜,就当是消费,福利捐款;总比花钱去抽烟喝酒,弄无三经强吧?”
再回到“钱袋里摸金币”的问题。我们可以类比“股票短线趋势投资”,一般经验是,若趋势一经开始,将会大概率延续。这里似乎有理论基础了。我们假设未来有三种可能,一是连续上涨,二是连续下跌,三是有涨有跌。若已出现前面5天下跌,请问后面5天还会继续下跌(剩余一枚还是金币)的概率是多少? 前面的计算答案是2/3的概率。


雷达卡



京公网安备 11010802022788号







