最早博弈论研究是从零和博弈开始。比如交易中讨价还价,对方多赚一块,我就损失一块,对方损失一块,我就多赚一块,利益总量不变。
但是随着冷战时期大国博弈的出现,人们对零和模型开始感到不满——如果把对方的损失视作己方的收益,那么美苏双方都应该抢先动手打击对方。然而现实中双方都采取了“只要你不咬我,我保证也不咬你”的策略。于是人们转向非零和博弈研究,囚徒困境就是其中最著名的一个模型:
假设有两个小偷A和B犯事、私入民宅被警察抓住,警方分别单独审讯两人。警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑2年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑1年,而坦白者有功被减刑2年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
每个嫌犯可以有两种选择:坦白或抵赖,这是对警察而言,对于他的同伙来说,就是背叛或合作。
|
对每个嫌犯而言,仅仅从自己角度考虑的话,无论对方如何选择,背叛都是最佳选择。然而双方都选择背叛的话,只能各自得到两年刑期的不理想结果。那么如何解释人类的合作行为呢?
亚当.斯密发表《国富论》以来,人们相信追求私利的过程可以促进公共利益(如我前一篇博文所言,这是对斯密的误读),现在有人对此提出挑战了,这个青年就是约翰.纳什。他在1950后发表了《n人博弈中的均衡点》、《非合作博弈》两篇论文,证明了在多人博弈中,每个参与者都只有有限种策略选择、并允许混合策略的前提下,一定存在均衡策略。这个均衡是指博弈中这样的局面:对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。
以囚徒困境模型为例,嫌犯在博弈中不仅考虑怎样对自己最有利,还要同时考虑对方的选择,而且考虑对方做选择的时候也一样会考虑自己的选择来做选择......这样,就很好的解释了冷战期间美苏双方的克制立场。零和博弈只适合“美苏之间必有一战”这个前题,然而这个前提并不成立,现实有多条路径可供选择。
双输的结果也是一种纳什均衡,例如在有些地方,我们知道他们在撒谎,他们也知道我们知道他们在撒谎,我们也知道其实他们知道我们知道他们在撒谎,他们也知道我们是假装他们没在撒谎……大家彼此靠谎言,而且互相都确知这是谎言来度日。
1994年诺贝尔经济学奖授予了约翰.纳什,电影《A Beautiful Mind》记述了他的生平。与另一部以第三人称视角拍摄的纯纪录片不同,导演邀请纳什本人参与了电影创作,这使我们有机会走进这位天才的心灵世界。影片中有些桥段哲学意味颇浓,几乎不可能出自导演本人的构想。
纳什泡妞这段,在星空中找出雨伞、章鱼等等美妙的图案,展示了天才在看似纷乱无章事物中找寻规律的能力,这与他二战期间帮助盟军破译密码使用的是同样的技巧。这是暗示星空中蕴含上帝的密码?或者仅仅是精神分裂症患者头脑中的妄想?
再比如纳什求婚这段对白:
纳:我需要一点证明,一些可以作为依据的资料。
艾:......一个证明?能证实的事实?好吧,告诉我宇宙有多大?
纳:无限大
艾:你怎么知道?
纳:因为所有资料都是这么指示的
艾:可是它被证实了吗?
纳:没有
艾:有人亲眼见到吗?
纳:没有
艾:那你怎能确定呢?
纳:(一脸懵逼地)不知道,我只是相信
获得诺奖后,纳什在致词中说道:“我一直相信数字,不管是方程式或逻辑学,都引导我们去思考。但经过终生的追求,我问自己:逻辑到底是什么?谁去决定原由?我的追求带领我穿过了物理,形而上学,幻觉,又带了回来。在事业上我有了最重大的突破,在生命中我也找到了最重要的人,只有在这神秘的爱情方程式中,才能找到逻辑或原由来。”
影片结尾这样评价:纳什理论左右了全球贸易谈判、全国劳工关系,甚至使生物进化学有了重大的突破。
萨缪尔森曾说,一个学会了供应和需求两个词的鹦鹉就可以成为一个经济学家,在进化博弈论方面颇有造诣的坎多利借用了这个梗:如今这只鹦鹉还需要学会两个词——纳什均衡。