楼主: yangls728
10479 36

[合作博弈] 纳什获得诺奖是尴尬的 [推广有奖]

11
yangls728 发表于 2019-2-8 11:58:02
罗鹏 发表于 2019-2-8 00:38
没看出来有什么逻辑矛盾。
再说,个体理性已经否定了这种情形(也就是说,不管它是否逻辑矛盾,它已经被 ...
摘自《完整揭示纳什均衡概念的内涵及解决囚徒的困境》一文:
第 2 种证法。
我们先来分析,在假设 B 选择认罪的情况下,关于 A 的推理:
从表面看,似乎有 4 种策略组合:(A 认罪,B 认罪);(A 认罪,B 不认罪);(A 不认罪,B 认罪);(A 不认罪,B 不认罪)。如果它们都具有存在性,那么,它们就都会具有相容性;否则,如果某个方案会导 致矛盾,则按照上文希尔伯特的话,这个方案在理论上就不存在。
①假设 B 选择认罪,这意味着 B 认为这样做会对自己有利(回报(payoff)高于对方)或起码与对方回 报均衡。
②能与 B 认罪回报均衡的只能是 A 认罪,所以, B 认为选择认罪对自己有利的理由就只能是假设 A 选择不认罪。
③A 选择不认罪,这意味着 A 认为这样做会对自己有利或起码与对方回报均衡。
④能与 A 不认罪回报均衡的只能是 B 不认罪,所以,A 认为选择不认罪对自己有利的理由就只能 是假设 B 选择认罪。
⑤上面这个结论显然是荒谬的,这表明,在假设 B 选择认罪的条件下,策略组合(A 不认罪,B 认 罪)会导致逻辑矛盾,所以,该策略组合在理论上不存在。
再看在假设 B 选择不认罪的情况下的 A 的推理:
①假设 B 选择不认罪,这意味着 B 认为这样做会对自己有利或起码与对方回报均衡。
②能与 B 不认罪回报均衡的只能是 A 不认罪,所以,B 认为选择不认罪对自己有利的理由只能是 假设 A 选择认罪。
③上面这个结论显然是荒谬的,这表明,在假设 B 选择不认罪的条件下,策略组合(A 认罪,B 不 认罪)会导致逻辑矛盾,所以,该策略组合在理论上不存在。
综上分析,在(A 认罪,B 认罪)、(A 认罪,B 不认罪)、(A 不认罪,B 认罪)、(A 不认罪,B 不认罪) 4 种情况中,只有(A 认罪,B 认罪)和(A 不认罪,B 不认罪)是有意义的(有效的)策略组合;但两相比较, 显然后者为优——这就是对最优方案的证明。
第 3 种证法。
①假设对方认罪:如果我认罪,对方不会反对;如果我不认罪,对方求之不得。这就是说,在假设 对方认罪的条件下,不管我选择怎样的策略,对方都不会吃亏,这就是对方选择认罪策略的初衷(注: 对方的这个看似万全的策略并不高明,因为如果人人都这么想,就得不到最好的结果,这样说来,两个 囚徒都不算理性人)。对方的这种出于保守心态的初衷,决定了推理前提的稳定性(注:指的是,就选择此策略的目的而言,理由是充分的,因而,此策略一经选定,无需改变),从而,策略组合(我认罪, 对方认罪)与(我不认罪,对方认罪)就是可比较的,结论是,我应该也选择认罪。上述分析说明,策 略组合(我不认罪,对方认罪)在理论上是不存在的(需要说明的是,这个结论是通过比较法得来的)。
②假设对方不认罪:如果我也不认罪,对方不会反对;如果我认罪,就会发生对对方不利的结果。 由于双方是同时做决策的,所以,从纯思辨的角度讲,对方有理由改变策略,照此说来,假设前提似乎并不具有稳定性。于是,基于推理前提的可变性,策略组合(我认罪,对方不认罪)与(我不认罪,对方不认罪)就是不可比较的,所以,在假设对方不认罪的条件下,“我应该认罪”就不具有逻辑必然性, 换一种说法,策略组合(我认罪,对方不认罪)在理论上是不存在的。同样值得说明的是,这个结论是 基于无法应用比较法得来的。
基于双方被假设都是理性人:我想,如果我选择认罪,对方就会改变策略,到头来,双方都获刑期 10 年;如果我也选择不认罪,双方均获刑期 1 年。看来,我的合乎理性的做法应该是也选择不认罪。其实,对方知道我会这么想,也相信我会这么做,因为这是基于遵从相容性、遵从逻辑必然性所得到的信念,这就是对方选择不认罪这一策略的初衷。基于这样的分析,在假设对方不认罪的情况下,我应该也选择不认罪。依据上述纯思辨思维的分析,说实在的,我们假设的对方所选择的不认罪策略,其实并非真正不具有稳定性,相反,它所具有的才真正称得上是理性意义的稳定性;至于前面我们说它似乎并不具有稳定性,那只是仅仅针对对方为了“应对”我的非理性做法(选择认罪)而言的。需要说明的是, 虽然我们假设的对方所选择的认罪策略具有稳定性,但由于这个策略选择目的的保守性(注:只是求得 不吃亏,而不是把收益最大化作为追求目标,这显然是与理性人的特质不相符的),这个稳定性就不具有终极的意义,即所选策略不构成囚徒困境博弈最优解的组成部分。
综上所述,对方认罪我认罪,对方不认罪我亦不认罪,两相比较,我们终于可以以理性的名义宣布:两个囚徒都应该选择不认罪。以上,就是对最优方案的证明。

12
yangls728 发表于 2019-2-8 11:59:02
罗鹏 发表于 2019-2-8 00:38
没看出来有什么逻辑矛盾。
再说,个体理性已经否定了这种情形(也就是说,不管它是否逻辑矛盾,它已经被 ...
学界普遍认为,囚徒困境所反映的是个人理性与集体理性之间的矛盾,例如,阿维纳什∙迪克西特的《策略博弈》一书第26页写道:“所有参与人的理性策略互动有可能产生对所有人不利的结果,比如囚徒困境。”笔者不能同意这种观点。从非反思的角度看,你可以认为“一人认罪另一人不认罪”对于认罪一方而言具有稳定性,因为他改变策略会使收益变差(注:实质上相同的说法还有,例如,迈克尔・马希勒等作者的“博弈论”第075页写道,策略组合(不认罪,不认罪)是不稳定的,因为每个参与人如果放弃这个策略而选择认罪,就可以得到更高的收益),但这只是假象,它并非是真实存在的,因为它会导致逻辑矛盾(参见拙文《完整揭示纳什均衡概念的内涵及解决囚徒的困境》中“2.2”中的“第2 种证法”)。因此,在假设对方选择不认罪策略的情况下,如果我选择认罪的策略,这不能被看作是我的个人理性,相反,这说明我的做法是非理性的。事实上,真正的个人理性与集体理性应该是相容的,统一的。这就是说,囚徒困境的发生,并不是由于个人理性与集体理性之间存在着内在的矛盾造成的,而是由于人们的无效推理造成的。
为了通俗起见,这里打个比方。闯红灯可以为我带来最大的时间收获,但这种做法能称作是我的个人理性吗?由此而造成的交通事故能归结为是由于个人理性与集体理性之间存在矛盾的缘故吗?笔者不反对把闯红灯可以节约时间叫做个人利益,但绝不认可这是个人理性。个人利益与个人理性不是同一个概念。前者只需直接性思维就可以得出结论,后者则否,它需要思辨思维(反思性思维)才能够达到结果,因为它不允许逻辑矛盾的发生。在囚徒困境博弈中,假设对方选择不认罪策略,这时我如果选择认罪策略,这种做法可以认为符合我的个人利益,但不能说它反映了我的个人理性。

13
yangls728 发表于 2019-2-8 11:59:43
罗鹏 发表于 2019-2-8 00:38
没看出来有什么逻辑矛盾。
再说,个体理性已经否定了这种情形(也就是说,不管它是否逻辑矛盾,它已经被 ...
在囚徒困境博弈中,最优解(不认罪,不认罪)不具有稳定性吗?
迈克尔・马希勒等作者的“博弈论”一书(“这是一本让世界等了几十年的著作,它对博弈的数理理论给出了权威而又全面的阐释,三位作者也是此领域中世界级的专家。”——诺贝尔经济学奖获得者罗伯特・奥曼;“本书是博弈论高级教程中最好、最全面的教科书。”)第075页,在谈到囚徒的困境时写道,策略组合(不认罪,不认罪)是不稳定的,因为每个参与人如果放弃这个策略而选择认罪,就可以得到更高的收益。
笔者认为,上述说法是不成立的,理由是:
(1)如果我放弃不认罪策略而选择认罪可以得到更高的收益,那么,这样的结论对于对方同样成立,因为两个人在博弈中所处的地位是对称的,但这两个结论是不相容的,矛盾。再说,如果两人都放弃不认罪策略而选择认罪,不仅不会使双方得到更高的收益,反而变差,矛盾。
(2)如果这里的“每个参与人”只是对其中一人而言(注:这应该是书作者的真实想法,因为该书写道:策略组合(不认罪,不认罪)是不稳定的,因为每个参与人偏离这个策略而选择认罪,可以让自己得到更高的收益(5而不是4),让对方付出代价(收获0)),但一人认罪另一人不认罪这种情况,根据拙文《完整揭示纳什均衡概念的内涵及解决囚徒的困境》关于囚徒困境博弈最优解的第二种证法可知,同样会导致矛盾。
(3)抛开具体问题不论,单就最优解这个概念的内涵而言,应该是,最优解必具有稳定性,不具有稳定性的策略组合不可能是最优解。笔者已在拙文《完整揭示纳什均衡概念的内涵及解决囚徒的困境》中用三种方法证明了(不认罪,不认罪)是囚徒困境博弈的最优解,据此说明,迈克尔・马希勒等作者的“策略组合(不认罪,不认罪)是不稳定的”这一结论是不成立的。
阿维纳斯•迪克西特等作者的《策略博弈》一书第122页中写道:“如果某个最终结果不是纳什均衡,那么其中至少有一个参与人可以通过改变行动来获得更高的支付。”笔者质疑的问题是,学界既然不认可(不认罪,不认罪)是纳什均衡(理由是它不符合纳什均衡概念的定义),那么,按照阿维纳斯•迪克西特等作者的说法:①如果只有一人可获得更高的收益,但这是不可能的,因为两人在博弈中所扮演的角色是对称的,所以,如果一人能获得更高的收益,那么,另一人也应该能够做到。②如果两人都获得更高的收益,但这同样是不可能的,因为在警方的游戏规则中,找不到能够满足这种结果的条款,能够找到的是正好相反的结论,即双方改变策略后收益不升反降。事实上,阿维纳斯•迪克西特说的并没有错,这只能说明,学界不认可(不认罪,不认罪)是纳什均衡是错误的,归根结底,问题出在纳什均衡概念的定义(指内涵)上。

14
yangls728 发表于 2019-2-8 12:06:37
罗鹏 发表于 2019-2-8 00:43
如果说(坦白,抵赖)或(抵赖,坦白)是逻辑矛盾的,那也是警方的坦白从宽、抗拒从严的政策造成的,你总不 ...
警方的游戏规则没有矛盾。

15
yangls728 发表于 2019-2-8 13:16:48
罗鹏 发表于 2019-2-8 00:43
如果说(坦白,抵赖)或(抵赖,坦白)是逻辑矛盾的,那也是警方的坦白从宽、抗拒从严的政策造成的,你总不 ...
我们所能做的工作,犹如法院的工作性质,只能按照警方的游戏规则行事,至于警方的游戏规则是否合理,那是属于人大的工作性质,它们是制定法律的。但是,再强调一次,警方的游戏规则是相容的,没有矛盾,对于任何一种可能情况,都只有一种处理规则,而不会出现相互矛盾的处理规则。

16
罗鹏 发表于 2019-2-9 19:22:16
帖那么多,你看懂了多少?
前提看懂了吗?
一次性博弈,这是一个重要前提。
同时行动又是一个重要前提。
在这些前提下,(抵赖,抵赖)就不是一个均衡。

17
yangls728 发表于 2019-2-9 19:26:40
这种交流真费劲,有不可理喻的感觉,免了。

18
yangls728 发表于 2019-2-15 16:09:59
罗鹏 发表于 2019-2-9 19:22
帖那么多,你看懂了多少?
前提看懂了吗?
一次性博弈,这是一个重要前提。
本来不想再回复这个帖子了,原因是,前面我已经花费时间发了好几个帖子,道理都在里边。我既写有文章,又连发好几个帖子,对方连看都没有看就妄加评论,质疑我“帖那么多,你看懂了多少?前提看懂了吗?一次性博弈,这是一个重要前提,同时行动又是一个重要前提。在这些前提下,(抵赖,抵赖)就不是一个均衡。”基于这种情况,我怀疑回复是否值得?但又一想,这里面的问题,毕竟涉及思辨思维,理解和表述都是比较困难的,不看僧面看佛面,还是说说看法,与同好共同学习商榷为好。
①是我真的没有看懂前提,竟然不知道“一次性博弈,这是(囚徒困境问题——笔者注)一个重要前提”吗?查阅我的《完整揭示纳什均衡概念的内涵及解决囚徒的困境》一文就会知道,文中“2.8 对囚徒的困境的‘重复博弈’的解决方案的评论”中明确写道:“笔者认为,囚徒的困境的原问题是个‘单次’博弈行为,不存在‘未来合作’这个概念,因此,人们没有理由改变原问题的条件,即把问题设计成需要实施多次博弈,所以,‘重复博弈’不是囚徒的困境的原问题的解决方法。”
②是我真的没有看懂前提,竟然不知道“同时行动又是(囚徒困境问题——笔者注)一个重要前提”吗?查阅我的《完整揭示纳什均衡概念的内涵及解决囚徒的困境》一文就会知道,我在文章摘要“结论”部分第1条就明确写道:“①囚徒的困境发生的原因在于,参与人在推理时把假设对方的选择当作是逻辑上在先的,把自己的策略当作是逻辑上属后的,但事实上双方是同时做出选择的,而且,如果形成的策略组合不是纳什均衡,那么,它在理论上就不具有存在性。”
③对“在这些前提下,(抵赖,抵赖)就不是一个均衡”的反驳。
迈克尔・马希勒等作者不承认策略组合(不认罪,不认罪)具有稳定性(注:当然不承认它是纳什均衡),理由是“因为每个参与人如果放弃这个策略而选择认罪,就可以得到更高的收益”。我的反驳理由是——如果我放弃不认罪策略而选择认罪可以得到更高的收益,那么,这样的结论对于对方同样成立,因为两个人在博弈中所处的地位是对称的,但这两个结论(我获释,对方获最高刑期;对方获释,我获最高刑期)是不相容的,矛盾。
当你假设对方选择了不认罪策略,据此,你可能会选择认罪策略,但这不能算是完成了“一次性”博弈,不能算是个人理性战胜了集体理性。下棋水平比较好的人,会想到接下来的好几步,真正的高手,可能会想到十步八步,但这只是在打肚皮官司,是看不见的斗智(尚未实现的博弈),因此,只要双方棋子尚未落盘,就不算真正出手。根据亚当斯密经济学理论的假设前提,参与者都是理性人,他们的智商相当,也就是说,你能想到的对方也会想到。你假设对方不认罪,所以你会选择认罪,难道对方就预料不到这一点吗?不可能!针对你的思路,对方就不会选择不认罪,会让你的假设前提落空(这才是真正意义上的博弈,是货真价实的思辨思维)!矛盾!这说明假设对方不认罪你选择认罪,这是不合理的,原因很简单,对方不认罪你认罪,这不是一个均衡,不具有稳定性,吃亏的一方必会改变策略。
抛开具体理由不论,我们只需考虑一般原则。既然双方都是理性人,都聪明绝顶,智商相当,那么,怎么会出现一人胜出另一人吃亏这种结局呢?
鉴于对方选择不认罪策略是你的推理前提,那么,你如何解释对方会选择不认罪策略的初衷呢?难道对方就是为了伸长脖子,吃你一刀,好让你全身而退(无罪释放)而他自己却要落个最长刑期的下场吗?有这么傻的理性人吗?要知道,理性人可是对目的和手段具备极强的分析和比较能力的聪明绝顶之人啊!
再说,你的推理与你所说的“同时行动又是一个重要前提”是自相矛盾的,难道不是这样吗?你的推理前提是假设对方不认罪,这就是说,对方的行动逻辑上在先,你的行动逻辑上在后,这怎么能算是(逻辑上)同时行动呢?也许你会反驳我:“那么,如果我也选择不认罪呢?难道情况就改变了吗?难道就不再是对方行动在先我在后了吗?”我的回答是:是这样的。你的反驳理由只是表面现象,因为当双方的斗智(思想博弈)结果最后达到了均衡,即想到一块儿了,认为两人都应该选择不认罪,这假设前提就是双方共同的思想产物,这就是同时行动的体现。什么才是同时行动(思维)呢?笔者认为,其特点是,不论推理前提是什么,应该允许对方以你的推理结论作为前提继续推理,直至双方想到一块儿了,不再产生矛盾了,也就是达到了一个均衡为止。笔者认为,假设对方不认罪,你可能会选择认罪,这个思维环节是必然会出现在双方的思维斗智过程中的,但这绝不是你所说的“一次性博弈”,这就像下棋高手在棋子落盘前的一种假设,由于发现行不通(这里指会导致矛盾),这种假设又会被否定一样——这不是真正的悔棋,而是理性盘算,是思想实验(试验)。
人们(包括顶级的博弈论专家)承认“同时选择”是一回事,在具体分析中能否真正做到这一点是另一回事。例如,阿维纳什・迪克西特等作者在《策略博弈》一书第77页写道,“参与人都是同时做出这些选择的”,但书作者却认可“假设对方选择不认罪策略,我会选择认罪策略”在理论上的存在性,这就违背了自己的观点,因为这明明是让对方的选择逻辑上在先,让自己的选择逻辑上在后。
在我的《完整揭示纳什均衡概念的内涵及解决囚徒的困境》一文“最优方案的三种证明方法”中的“第3种证法”中,可以看到两个囚徒斗智斗勇“同时思考”的跌宕起伏的完整过程(见11楼)。当两个囚徒都想明白了,双方都应该选择不认罪策略,这时,均衡终于出现了——这是囚徒困境全剧的高潮,也是光彩夺目的剧终!

19
yangls728 发表于 2019-2-18 21:09:54
亚当斯密经济学理论的基本假设前提是博弈参与者是理性人,理性人应该对博弈的目的和手段具有足够强的认识和驾驭能力。两个囚徒是博弈参与者,应是理性人,但他们的决策未能得到最优解,这是否说明亚当斯密的理性人假设是不合理的?笔者认为,两个囚徒之所以没有达到目的,并非说明亚当斯密的理性人假设不合理,而是两个囚徒的推理有误,因而他们不配称作理性人。与上述质疑相反,笔者认为,亚当斯密的理性人假设与马列主义认识论的“真理是可知的”原理是相吻合的。马丁•苏比克认为(1970)——“囚徒的困境这个难题是永远也解决不了的”,这个观点是与马列主义认识论的基本原理(真理是可知的)相违背的,是站不住脚的,它误导人们徒劳的为错误的结论(两个囚徒都应该选择认罪策略)辩护。
笔者认为,囚徒困境难题,解决方向性问题要比解决技术性问题更为重要!看看那些世界顶级的博弈论专家们的观点就知道了,尽管这些大家们知识渊博,但他们的方向错了——他们居然能够认可与客观事实相矛盾的结论及其推理的有效性,这就使得囚徒困境问题无法得到解决。这些博弈论大家们之所以会犯方向性错误,唯一合理的解释是,思辨思维不是他们的强项,他们不擅长处理这类被称作是悖论的问题。想一想国内外学界关于悖论的定义迄今仍众说纷纭,我国非常著名的逻辑学者在自己的悖论专著中,关于悖论的定义竟前后矛盾,这样说来,博弈论专家们难以处理囚徒困境难题,也就不足为奇了(注:笔者准备出版一本叫做《悖论是什么》的书)。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
1993110 + 5 + 5 + 5 + 5 精彩帖子

总评分: 论坛币 + 5  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

20
1993110 发表于 2019-2-24 09:51:47
yangls728 发表于 2019-2-18 21:09
亚当斯密经济学理论的基本假设前提是博弈参与者是理性人,理性人应该对博弈的目的和手段具有足够强的认识和 ...
(注:笔者准备出版一本叫做《悖论是什么》的书)。


悖论问题----理 发 师 悖 论 初 解

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-29 10:07