评诺奖评委观点:纳什均衡可能一败涂地,若干年后将变成一大丑闻
——兼评纳什均衡的一个循环定义
杨六省
“瑞典皇家科学院、诺贝尔经济学奖委员会委员,斯塔尔说;纳什均衡是一个博弈取胜的幻想,他自己也不知道怎么均衡、不知道怎么单方占优、不知道怎么取胜。因此,纳什在世期间不会向世人做出博弈如何取胜的解释,所以他一直保持沉默。斯塔尔还说;我们今天既然把纳什均衡带到公众面前,可以断定,未来一定会出现博弈的取胜理论,大家担心纳什均衡可能一败涂地,若干年后将变成一大丑闻。”
来源:美国资讯网;麻省理工福布斯纳什-著名大学名人-正文-时间:2013-12-02
笔者不赞同上述最后观点。笔者认为,纳什均衡概念是对一个策略组合某个方面的稳定性的反映,它所描述的是一种客观存在,所以,不存在纳什均衡若干年后将变成丑闻这种可能。
但话说回来,纳什均衡概念确实是有缺陷的,这里是指其定义的内涵是不完全的。正是由于这个缺陷,才导致在囚徒困境博弈中发生种种混乱,例如,
被认为是合乎逻辑的推理结论(指囚徒应该认罪)却与客观事实不符;
最优解得不到理论支持;
最优解不具有稳定性;
认罪被证明是占优策略,但占优策略均衡(认罪,认罪)却不是最优解;
……
如果把上述种种背理现象称作丑闻,笔者倒并不反对,因为它们确实让理性蒙羞!可不是嘛?人们“证明了”认罪是占优策略,即不管对方采取什么策略,只要参与者使用这一策略,都可以给自己带来最大的收益。毫无疑问,这个结论理应对于两个囚徒都是适用的。但是,实际情况呢,两人都采用这一策略,并不能给各自带来最大的收益。在这种情况下,斯塔尔批评纳什“不知道怎么单方占优、不知道怎么取胜”,难道是没有道理的吗?
如果我们采用哈林顿书中的规定,这就要求我对其他参与者的行为的信念必须是正确的(参见小约瑟夫・哈林顿的《哈林顿博弈论》第63-64页),对此,笔者提出两点质疑:
①如果我已经有了对其他参与者的行为的正确信念,那么,根据这一信念我就能够很容易地确定我的最优反应,何必需要再定义一个没有用途的纳什均衡概念呢?
②如果我还没有产生对其他参与者的行为的正确信念,那么,纳什均衡概念就应该具有能够帮助我建立对其他参与者的行为的正确信念的作用,否则,它就不具有存在的必要性,因为我的最终目的是要确立我的最优策略,而能够达到这一目的的先决条件是我具有对其他参与者的行为的正确信念。
上述第②点质疑,会导致如下情况:要定义纳什均衡,其前提是我必须具有对其他参与者的行为的正确信念,而我要建立对其他参与者的行为的正确信念,又必须借助于纳什均衡概念,这难道不是循环定义吗?欧文・M・柯匹说得好,他说(《逻辑学导论(第11版)》,中国人民大学出版社,2007年,第147页),“定义循环有时甚至会使老练的科学家陷入圈套。”情况确实如此。
上述两点质疑说明,把“我对其他参与者的行为的信念必须是正确的”作为给纳什均衡概念下定义的条件,是不合理的。
抛开哈林顿的不当条件不论,斯塔尔批评说,“纳什均衡是一个博弈取胜的幻想,他自己也不知道怎么均衡”,这种批评事实上并非完全没有道理。理由是,纳什并没有告诉人们如何借助于纳什均衡概念才能知道其他参与者的行为,而我不知道其他参与者的行为,又如何确定我的最优反应呢?事实上,关于如何知道其他参与者的行为,纳什不仅没有给出任何具体指导意见,甚至连应该遵循的原则也不曾提及。
笔者在《完整揭示纳什均衡概念的内涵及解决囚徒的困境》一文中说过:满足相容性和遵从逻辑必然性是博弈论的两条大道理,这是理性行为的核心意涵(应用数学进展, 2018, 7(10): 1317-1324. http://www.hanspub.org/journal/AAM/ ”)。关于如何建立我对其他参与者的行为的正确信念,笔者认为,不可能有具体方法可循,这样说来,逻辑必然性就成了唯一值得信赖的导师了。在囚徒困境博弈中,学界普遍认为,两个囚徒是各自自主决策的。笔者并不认同这种观点,理由是,一个博弈的最优解如果是客观存在的,那么,它必有充足的理由,这就是逻辑必然性。逻辑必然性是不以人的意志为转移的。只有遵从逻辑必然性,才是理性行为的真正意义所在,而所有参与者都遵从逻辑必然性行事就是合作。所以,笔者认为,在博弈论中并不存在绝对意义的自主决策。
然而,要揭示一个博弈的必然逻辑结果,并不是一件容易的事,这是对每个参与者的思辨思维能力的考验。可不是嘛,想想看,一个囚徒困境问题,已让学界困惑了整整68个年头;同样是在这么长的时期内,纳什均衡概念的定义(指内涵)依然不是完善的。但这两个问题也并不是不可解决的,理由是,人们(包括纳什本人)没有对纳什均衡概念给出完整的定义(指内涵)是一回事,纳什均衡概念本身有着自己的客观内涵是另一回事;人们在推理中犯错是一回事,人们应该和能够根据纳什均衡概念的客观内涵进行正确推理从而得出正确结论是另一回事,不能把二者混为一谈。笔者在《完整揭示纳什均衡概念的内涵及解决囚徒的困境》一文中,对纳什均衡定义的内涵给出了完整的揭示,澄清了人们以往的推理错误,笔者相信,自己已经解决了囚徒困境难题,从而本文开头的那些所谓丑闻已经不复存在了。笔者还认为,人们依旧可以借助于纳什均衡概念对博弈事件进行相关的分析和推理(注:笔者主张,不要把“我对其他参与者的行为必须有正确的信念”作为给纳什均衡下定义的条件,这个定义的表述仍然是:如果其他任何人的策略都不改变,我无需或不能改变我的策略,这样的策略组合就叫做纳什均衡,只不过关于其中的我不能改变我的策略的理由,笔者认为,还应该包括如果我改变了我的策略,则会导致逻辑矛盾的发生),这就是说,纳什均衡并不会像斯塔尔所说的,可能一败涂地,从而退出博弈论,它仍会是有用的,因为它反映的是一种客观存在的现象。
无论是否把“我对其他参与者的行为的信念必须是正确的”作为给纳什均衡下定义的条件,纳什均衡概念的内涵都不会是完全的,事实上,众多不相容现象发生的原因也正由于此,这表明,纳什对纳什均衡概念的认识并不成熟,也就是说,纳什提出的纳什均衡概念仍存在缺陷,基于这种理由,笔者认为,诺贝尔经济学奖得主梅耶森对纳什均衡的评价并不恰当,他说,发现纳什均衡的意义,可以和生命科学中发现DNA的双螺旋结构相媲美。即使对纳什均衡的定义(指内涵)进行补充,就像笔者所做的那样,但由于并不存在由纳什均衡概念可以直接推出其他参与者行为的可行方法,这就使得纳什均衡概念的使用价值大打折扣,基于这个原因,笔者仍然认为,梅耶森对纳什均衡的评价是不恰当的,不过这里是指过誉。