楼主: yangls728
1543 2

[学科前沿] 质疑《哈林顿博弈论》等几种国外知名教材中的几个观点 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

博士生

57%

还不是VIP/贵宾

-

威望
0
论坛币
54 个
通用积分
1.0650
学术水平
40 点
热心指数
40 点
信用等级
40 点
经验
475 点
帖子
49
精华
0
在线时间
601 小时
注册时间
2018-11-2
最后登录
2024-4-25

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

质疑《哈林顿博弈论》等几种国外知名教材中的几个观点

杨六省

囚徒困境问题,60多年过去了,为什么难以得到解决?笔者认为,是由于人们缺乏正确的哲学思想作为指导原则。马列主义认识论的基本原理是,正确思想与客观存在是统一的。当囚徒的推理结论(应该选择认罪策略)所产生的结果并非是预期的最优解,人们不是断然地否决这个结论,仔细地检查推理究竟错在何处,而是接受了这个结论,认可了这个推理的有效性,这就成为了其他所有错误观点的根源,因为替一个错误结论的自圆其说做辩护,不可能具有合理性。实践是检验真理的唯一标准。任何违反客观存在的理论,任何导致逻辑矛盾的理论(注:相容性是存在性的必要条件),都是站不住脚的——应当,必须,必然会被否定!下面是笔者对国外几种知名的博弈论教材中几个观点的质疑。

① 为了保证理论的一致性,学界务必对纳什均衡概念的两个不等价定义作出取舍

小约瑟夫・哈林顿的《Games ,Strategies And Decision Making》一书,被誉为美国最优秀的博弈论本科教材,被美国多所著名大学长期采用。该书中译本第64页(中译本书名叫《哈林顿博弈论》,人大出版社,2012年),关于纳什均衡概念的定义,给出了如下两种表述:

(a)若每个参与者根据对其他参与者策略的信念,采用最大化自身收益的策略,则这样的一个策略组合就是纳什均衡。(笔者注:《哈林顿博弈论》第63页写道:“纳什均衡要求每个参与者对其他参与者的信念是正确的。”)

(b)每个参与者所选策略一定是对其他参与者所选策略的最优反应。

很明显,上述两种表述的差异在于,前一种表述含有“信念”一词,后一种没有。在囚徒困境博弈中,如果我们采用第一种定义,那么,我对对方的信念是,对方一定会选择不认罪策略(注:相信对方一定会选择认罪策略的信念是错误的,理由有两个方面:一是从理论上讲,人们以往关于这一信念的推理是无效的,事实上,也不可能存在有效证明(参见: 杨六省. 完整揭示纳什均衡概念的内涵及解决囚徒的困境[J]. 应用数学进展, 2018, 7(10): 1317-1324. http://www.hanspub.org/journal/AAM/ ),二是从实践上讲,如果认可这样的信念,那么,双方都会选择认罪策略,这样就会导致囚徒困境),同时,我也会选择不认罪策略(注:在相信对方会选择不认罪策略的情况下,如果我选择认罪的策略,则会导致逻辑矛盾,但理性人是不应该让自己的行为导致逻辑矛盾的),故(不认罪,不认罪)是囚徒困境博弈唯一的纳什均衡(注:这里应该采用拙文关于纳什均衡概念的新定义,因为旧定义是有缺陷的)。如果采用第二种定义,即不涉及我的信念,那么,囚徒困境博弈就有两个纳什均衡,即(认罪,认罪)和(不认罪,不认罪)。基于采用不同的定义会导致不同的结论,这说明两种定义方法不是等价的,为了保证理论的一致性,学界务必在两个不等价的定义之间作出取舍。对于其他参与者行为的正确信念的形成,应该是认识终点的事。我们不可能从结果开始,我们只能从搭建脚手架开始。基于这个道理,笔者认为,第二种定义方法是比较合理的,采用这种比较宽松的定义,无需考虑自己究竟具有怎样的信念,只需根据所给条件和纳什均衡概念的新定义,即可对是否是纳什均衡作出判断;至于哪个纳什均衡符合“信念正确”,只要通过择优比较就能做到,比如囚徒困境。

② 在囚徒困境博弈中,(认罪,认罪)是唯一纳什均衡的论断是正确的吗?

如上所述,如果我们采用纳什均衡概念的第一种定义,那么,在囚徒困境博弈中,我们就不能认可(认罪,认罪)是纳什均衡。如果我们采用第二种定义,那么,纳什均衡就有两个。这就产生了一个疑问,《哈林顿博弈论》第66页不是已经证明了(认罪,认罪)是唯一的纳什均衡吗?难道这个证明是无效的?我们说,这个论证的失误在于,应用了“认罪是囚徒困境博弈的占优策略”这个错误的结论,事实上,在囚徒困境博弈中,是不存在占优策略的。基于同样的理由,阿维纳什・迪克西特等作者的《策略博弈》(注:此书获得诺贝尔经济学奖得主保罗・萨缪尔森和约翰・纳什的推荐)中译本(人大出版社,2014年)第80页中的说法——“囚徒困境有三个本质的特征:……第三,对于两个参与人而言,占优均衡比选择劣策略时(即都选择抵赖或合作)的非均衡要差”——是没有意义的,因为在囚徒困境博弈中,本来就不存在所谓占优策略及占优均衡,当然也不存在所谓的劣策略。至于说,(不认罪,不认罪)是非均衡,这种说法是错误的。另外,上述《策略博弈》中译本第317页中写道:“第4.3节已经讨论过囚徒困境。那时我们就发现均衡的结果对于参与人来说都是不好的,‘囚徒’可以找到比均衡更好的结果,但却很难放弃均衡策略来实现这个结果。”笔者认为,这个说法是不成立的,即我们完全可以放弃“认罪”这个均衡策略,而采取同样可以被称作是均衡策略的“不认罪”策略,就可以达到那个“更好的结果”(参见拙文《完整揭示纳什均衡概念的内涵及解决囚徒的困境》关于囚徒困境博弈最优解的“第三种证法”)。

③ 在囚徒困境博弈中,最优解(不认罪,不认罪)不具有稳定性吗?

迈克尔・马希勒等作者的“博弈论”一书(注:“这是一本让世界等了几十年的著作,它对博弈的数理理论给出了权威而又全面的阐释,三位作者也是此领域中世界级的专家。”——诺贝尔经济学奖获得者罗伯特・奥曼;“本书是博弈论高级教程中最好、最全面的教科书。”——大卫・施迈德勒,俄亥俄州立大学)中译本(格致出版社,上海出版社,2018年)第075页,在谈到囚徒的困境时写道,策略组合(不认罪,不认罪)是不稳定的,因为每个参与人如果放弃这个策略而选择认罪,就可以得到更高的收益。

笔者认为,上述推理是不成立的,理由是:

(1)如果这里的“每个参与人”是同时指囚徒双方,但事实上,(认罪,认罪)不仅不会使双方得到更高的收益,反而变差。

(2)如果这里的“每个参与人”只是对其中一人而言(注:这应该是书作者的真实想法,因为该书写道:策略组合(不认罪,不认罪)是不稳定的,因为每个参与人偏离这个策略而选择认罪,可以让自己得到更高的收益(5而不是4),让对方付出代价(收获0)),但是,由于一人认罪另一人不认罪的情形不是均衡,不具有稳定性,从而,另一方也会改变策略而选择认罪,到头来,又会回到上述(1)。再说,一人认罪另一人不认罪这种所谓的策略组合,由于会导致逻辑矛盾(参见拙文《完整揭示纳什均衡概念的内涵及解决囚徒的困境》中关于囚徒困境博弈最优解的第二种证法),所以,它在理论上不具有存在性,从而,是不可以与(不认罪,不认罪)进行比较的,据此,也就推不出(不认罪,不认罪)是不稳定的这一结论。相反,真要说稳定性,(不认罪,不认罪)所具有的才是经历了过招、磨合这种精彩演练之后让人能够感受到真正具有理性味儿的稳定性。

(3)抛开具体问题不论,单就最优解这个概念的内涵而言,应该是,最优解必具有稳定性,不具有稳定性的策略组合不可能是最优解。笔者已在《完整揭示纳什均衡概念的内涵及解决囚徒的困境》一文中,用三种方法证明了(不认罪,不认罪)是囚徒困境博弈的最优解,据此说明,迈克尔・马希勒等作者的“策略组合(不认罪,不认罪)是不稳定的”这一结论是不成立的。

(4)如果书作者关于(不认罪,不认罪)不具有稳定性的理由是真实的,即其所言“每个参与人如果放弃这个策略而选择认罪,就可以得到更高的收益”是可实现的,那么,对我而言,(对方不认罪,我认罪)就是更优解,也是最优解;但是,同样有理由认为,(我不认罪,对方认罪)也是对方的更优解和最优解。然而,这两个结论是不相容的,于是,笔者的质疑是:是哪一个,抑或是两个同时都会发生呢?希尔伯特说,“如果一个概念具有矛盾的属性,那我就认为这概念在数学上不存在。”上述矛盾的发生表明,书作者关于(不认罪,不认罪)不具有稳定性的理由是站不住脚的,关于“(不认罪,不认罪)是不稳定的”结论是不成立的。

由对稳定性这个概念的思考,使笔者联想到了一个浅显的比喻。假设我位于某处。在我以往碰到的情况中,我周围的对比物只有平地、高地和洼地,于是,我会很容易地决定我是否需要改变位置,我所遵循的原则是,人应该朝高处走。某日,大雾挡住了我的视线,我只隐约觉得周围全是高地。直至大雾散去,我才发现,刚才的感觉是假象,我的周围已不是往日情景,它是万丈深渊!这时,我该如何抉择?难道我应该依旧应用以往的逻辑吗?也就是说,既然周围既不是平地,也不是洼地,这说明我的位置不具有稳定性,所以我应该改变位置(事实上是走向深渊)?在这种情况下,我难道不应该依据客观存在的事实修正我以往关于稳定性这个概念的定义吗?话题转到纳什均衡概念的定义(指内涵),笔者认为,以往人们关于纳什均衡概念的定义(指内涵)是有缺陷的,即关于不能改变策略的理由,不能只包括“改变策略会引起收益变差”,还应该包括“改变策略会导致逻辑矛盾”这一条。

④ 囚徒困境所反映的是个人理性与集体理性之间的矛盾吗?

学界普遍认为,囚徒困境所反映的是个人理性与集体理性之间的矛盾。例如,阿维纳什・迪克西特等作者的《策略博弈》中译本第26页写道:“所有参与人的理性策略互动有可能产生对所有人不利的结果,比如囚徒困境。”笔者的看法完全相反。笔者认为,个人理性与集体理性是统一的。在假设对方选择不认罪策略的情况下,如果我选择认罪的策略,这不能被看作是我的个人理性,相反,这说明我的做法是非理性的,因为我的这种选择会导致逻辑矛盾,从而表明(对方不认罪,我认罪)这种所谓的策略组合在理论上是不具有存在性的,是不能参与比较的,但我却让它参与了比较。简言之,囚徒困境的发生,是由于人们的无效推理造成的,而不是因为个人理性与集体理性之间存在着内在的矛盾造成的。

⑤ 是“自利行为”导致了较差的收益吗?

朱・弗登博格(2014年诺贝尔经济学奖得主)和让・梯若尔的《博弈论》(内容简介:“本书是经济学研究生和高年级本科生学习博弈论的最好教材。”)中译本(人大出版社,2015年)第10页关于囚徒困境写道:“尽管合作会为每个参与人提供收益1,但自利行为导致收益为0的无效率结果。”

笔者认为,上述提法是不正确的,因为无论是从理论上,还是实践上,这里所指的“自利行为”这个概念,都是不存在的:从事实上讲,囚徒的行为并没有达到自利的目的;从理论上讲,囚徒没有、也不可能证明“选择认罪会对自己有利”这一结论——对于前者,理由是,虽然囚徒自认为给出了证明,但那个证明是无效的,因为在假设对方不认罪的情况下,我选择认罪的策略,会导致逻辑矛盾,从而表明所谓的策略组合(对方不认罪,我认罪)在理论上不具有存在性,因而,是不可以与(不认罪,不认罪)进行比较的,所以,也就推不出“选择认罪会对自己有利”这一结论;对于后者,理由是,正确理论不可能与客观事实不一致。就此话题,说到底,是无效推理导致了收益不佳的后果。如果真要讲“自利行为”这个概念的存在性,那么,囚徒“选择不认罪策略”才是真正符合理性的“自利行为”(注:事实上,从警方告知的游戏规则,经过对比即可得知这一结论;至于理论证明,参见拙文:完整揭示纳什均衡概念的内涵及解决囚徒的困境)。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
yangls728 发表于 2018-12-7 10:43:55 |只看作者 |坛友微信交流群
“正确信念”与多个纳什均衡的存在是不相容的
每个参与人都会追求自身收益最大化,唯此才是其他参与人的正确选择,因此,我对其他参与人的“正确信念”,只能是指所涉及的博弈的最优解中的其他参与人的选择,这样说来,一个博弈存在多个纳什均衡就是不可能的。
查阅阿维纳什・迪克西特等作者的《策略博弈》中译本第78页,可发现书中就将纳什均衡概念的两个不等价的定义混为一谈,其他教科书的这种错误,不再一一列举。

使用道具

藤椅
graylens 发表于 2018-12-12 09:12:37 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 21:53