博弈论何以丧失了相容性?
杨六省
任何一门学科领域,如果其相容性问题没有得到解决,人们就会产生一种不安心理,犹如住在一幢地基不知是否牢靠的建筑物中,担心有朝一日发生崩溃!希尔伯特把算术公理的相容性问题列为其著名的23个数学问题的第二位,足见相容性问题的重要性。
博弈论是相容的吗?自从博弈论产生以来,尤其是自从纳什均衡概念和囚徒困境问题被提出以来,产生的不相容现象是如此之多,我们怎么能够说博弈论是相容的呢?难道情况不是这样吗?例如,在囚徒困境博弈中——
①被认为是合乎逻辑的推理结论(指囚徒应该认罪)却与客观事实不符。
注:对于一门应用学科而言,相容性概念当然包括理论务必与客观存在相一致的观点;同时,一门学科的相容性概念,也意味着与其他学科中的科学概念是不会冲突的。
②纳什均衡挑战了亚当·斯密的“看不见的手”原理。
③在非零和博弈中纳什均衡概念与帕累托最优概念是冲突的。
④个人理性与集体理性之间存在矛盾。
⑤最优解却得不到理论支持(证明)。
⑥最优解当然具有稳定性,但在反应稳定性属性的纳什均衡中找不到对应物。
⑦“认罪”被证明是占优策略,但占优策略均衡(认罪,认罪)却不是最优解。
⑧学界不认可(不认罪,不认罪)是纳什均衡,但这会导致矛盾。
……
博弈论的理论基础发生不协调是如此明显,在这幢建筑物中从事继续加高工作的博弈论专家和经济学家,难道能够做到心安理得?有人对上述矛盾进行辩护,这就如同想用毫不相干的填充物把地基裂缝的表面抹平从而就能消除危机一样,毫无用处。
人们在批评博弈论,学界也一直在争论纳什均衡概念的优缺点。笔者认为,纳什均衡概念是对一个策略组合某个方面的稳定性的反映,它所反映的是一种客观存在,所以无所谓优缺点问题,只有对这个概念的不同定义进行比较,才存在不同定义的优缺点问题。第一种定义(要求我对其他参与者的行为的信念必须是正确的)的优点是,它与亚当斯密经济学理论的假设前提(每个参与者都会追求收益最大化)相吻合,与最优解概念相吻合,与帕累托最优概念相吻合,缺点是,人们很难一步到位知道最优解。第二种定义(不要求我对其他参与者的行为的信念必须是正确的,例如,在囚徒困境博弈中,假设对方选择认罪策略)的优缺点与第一种定义的优缺点正相反对,因而这样的假设条件不一定与亚当斯密经济学理论的假设前提相吻合,不一定与最优解概念相吻合,不一定与帕累托最优概念相吻合,这是这种定义的缺点;其优点是,限制变得宽松了,容易展开讨论。但第二种定义的缺点也不是不可克服的,因为找出了一个博弈的所有的纳什均衡,就可以通过比较找到最优解,例如,在囚徒困境博弈中,我们可以对两个纳什均衡(认罪,认罪)与(不认罪,不认罪)进行比较,找到最优解(不认罪,不认罪)。这表明,第二种定义的缺点其实是无关紧要的,因为我们所给出的定义,在应用中只起到了脚手架的作用。事实上,最终结果是否能够满足协调性才是最为重要的。试想,一门学科如果连协调性这个最基本的要求都不能满足,又怎能称为科学呢?例如,最优解,帕累托最优,顾名思义,不可能再优化,它当然具有稳定性,但在囚徒困境博弈中,最优解(不认罪,不认罪)却在反映稳定性属性的纳什均衡中,找不到自己的对应物(因为人们并不认可两人都不认罪是纳什均衡),这难道不是博弈论中的一种非协调性的表现吗?再如,阿维纳斯·迪克西特等作者的《策略博弈》一书第122页中写道:“如果某个最终结果不是纳什均衡,那么其中至少有一个参与人可以通过改变行动来获得更高的支付。”笔者的质疑是,学界既然不认可(不认罪,不认罪)是纳什均衡(理由是它不符合纳什均衡概念的定义),那么,按照阿维纳斯·迪克西特等作者的说法:①如果只有一人获得更高的收益,但这是不可能的,因为两人在博弈中所扮演的角色是对称的,所以,如果一人能获得更高的收益,那么,另一人也应该能够做到。②如果两人都获得更高的收益,但这同样是不可能的,因为在警方的游戏规则中,找不到能够满足这种结果的条款,能够找到的是正相反对的结论,即双方改变策略后收益不升反降。事实上,阿维纳斯·迪克西特没有错,这只能说明,学界不认可(不认罪,不认罪)是纳什均衡是错误的,归根结底,问题出在纳什均衡概念的定义(指内涵)上。
总之,纳什均衡概念的两种定义的优缺点,并不是博弈论的原则性问题,而对于纳什均衡概念内涵的正确揭示,才是解决博弈论协调性问题的关键所在。纳什均衡概念的定义是:如果其他任何人的策略都不改变,我无需或不能改变我的策略,这样的策略组合就叫做纳什均衡。但对于这个定义的内涵,人们过去并没有意识到还有一种可能性应该考虑进去,这就是如果我改变了我的策略会导致逻辑矛盾,怎么办?此情况的缺失使得关于博弈论的相容性的讨论无从进行;尤其是,例如,在囚徒困境博弈中,关于(不认罪,不认罪)这个策略组合,如果其中的一人改变策略,即选择认罪,这就出现了“一人认罪另一人不认罪”的情况。笔者在《完整揭示纳什均衡概念的内涵及解决囚徒的困境》一文中(注:参见文中“2.2.最优方案的三种证明方法”中的第2种证法)已经揭示了,“一人认罪另一人不认罪”这种情况由于会导致逻辑矛盾,所以它在理论上不具有存在性。事实上,对“一人认罪另一人不认罪”的存在性的认可,正是文章开头所列举的一切不一致性现象的根源!说实在的,发现矛盾本来是修正理论的良好契机。遗憾的是,对名人的过度崇拜,阻碍了人们的质疑和思考,于是,人们对于矛盾的发生表现出麻木和容忍,甚至甘愿为错误做辩护!也许人们认为,逻辑可以与客观事实相分离,若真是如此,研究逻辑的意义何在?在很是久远以前,几乎所有的人都认为,太阳是在绕着地球转。但不管当时的主流观点是多么的强势和根深蒂固,现在呢?相反的观点倒成了常识!
顺便指出一点,客观公正地说,虽然纳什均衡概念是由纳什本人(1950年)提出的,但应该说,纳什本人对于纳什均衡概念并没有达到完整的认识,理由是,囚徒困境问题是1950年提出的,纳什是2015年去世的,囚徒困境问题与纳什在世有整整65年的交集,在此期间,纳什并没有解决囚徒困境问题,并没有对学界关于“纳什均衡挑战了亚当·斯密的‘看不见的手’原理”以及“在非零和博弈中纳什均衡概念与帕累托最优概念是冲突的”等观点给出合理的解释,难道不是吗?如果纳什认可这些观点,但这些观点是站不住脚的;如果不认可这些观点,并且给出过令人信服的解释,那么,这些观点早就应该销声匿迹了,但情况不是这样。牛顿和莱布尼茨“发明”了微积分,但他们并没有对微积分的基本概念给出合理的解释,这样说来,笔者认为纳什本人对纳什均衡概念并没有达到完整的认识,也没有什么可奇怪的,这就犹如说,某项技术是某人发明的,但当时他的想法还不够完善一样。基于这种道理,现在我们对纳什均衡概念的定义(指内涵)做修正,也就是一件很正常的事,只有这样做,文章开头的那些不相容现象才会得以消除。
对纳什均衡概念批评的正当性,并不在于针对这个概念的定义,而在于针对这个定义的内涵。纳什均衡概念在博弈中反映着一种稳定性。但是,这种稳定性有针对个人和针对集体之分(注:关于后者,笔者给出的界定是,只要满足纳什均衡概念的第二种定义,我们就说这样的策略组合对集体而言是稳定的),例如,在囚徒困境博弈中,你可以认为“一人认罪另一人不认罪”对于认罪一方而言具有稳定性,因为他改变策略会使收益变差(注:换一种说法,就如迈克尔・马希勒等作者的“博弈论”第075页所说的,策略组合(不认罪,不认罪)是不稳定的,因为每个参与人如果放弃这个策略而选择认罪,就可以得到更高的收益),但你不能说“一人认罪另一人不认罪”对于集体(参与的双方)而言具有稳定性,因为对于不认罪一方而言存在改变策略的动机。孔子说,己所不欲勿施于人。对方在假设我不认罪的情况下,认为他选择认罪的策略是合理的,我不会认可他的推理理由,但是反过来,难道假设对方选择不认罪而我选择认罪就是合理的?(注:可以说,在所有文献中,人们均属于后者,但为什么没有提及前者呢?)另一方面,如果我认可对方的推理理由,那么,双方就都不会选择不认罪,这样,又如何能够达到更好的结果(不认罪,不认罪)呢?难道充足理由律是不成立的?或者是,理由存在但不可知?笔者认为,这些都不是。笔者观察到的现象是,人们在推理中关于推理理由的选择,总是很容易想到参与人应追求收益最大化的一面,而忽视了参与人也应该是理性的一面,从而把针对个人的稳定性与针对集体的稳定性混淆了。在囚徒困境博弈中,不管是对于(认罪,认罪),还是对于(不认罪,不认罪),其中任何一人改变策略,都会导致逻辑矛盾,这样的策略改变就是不合理的。我们再把思考转向纳什均衡概念的定义——“如果其他任何人的策略都不改变,我无需或不能改变我的策略,这样的策略组合就叫做纳什均衡”,其中的“我不能改变我的策略”的内涵(理由),还应该包括“因为如果我改变策略,则会导致逻辑矛盾的发生”。这就很明朗了,简言之,对内含逻辑矛盾的“策略组合”的存在性的认可,是导致博弈论丧失相容性的根源。
学界普遍认为,囚徒困境的发生,是由于个人理性与集体理性之间存在矛盾。笔者并不认同这种说法,理由是,满足相容性是任何科学概念和理论具有存在性的必要条件,因此,既然一人认罪另一人不认罪会导致逻辑矛盾,也即认罪一方的做法(假设对方选择不认罪而自己选择认罪)会导致逻辑矛盾,那么,他的做法就不具有合理性,不具有理论上的存在性,应该被否决,不予考虑。这样说来,所谓的双方,其实只有一方真实存在,那么,何来“两方之间存在矛盾”之说?(注:不要把“个人利益与集体利益之间存在矛盾”与“个人理性与集体理性之间存在矛盾”混淆了,因为二者并不同一。每个参与者都希望达到收益最大化,但能够达到这个目的的具体做法不一定是合乎理性的,例如,在囚徒困境博弈中,假设对方是理性人,那么,他一定会选择不认罪策略,这时,尽管你可以通过选择认罪策略而达到收益最大化,但这是不符合理性的,表明你不是一个理性人。)简言之,认罪一方的做法并非是真正理性的,或者干脆说,没有资格称作是理性的,故务必否决,这就是囚徒困境的解决之道。