楼主: yangls728
10320 3

[合作博弈] 纳什均衡与帕累托最优是冲突的吗? [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

博士生

57%

还不是VIP/贵宾

-

威望
0
论坛币
54 个
通用积分
1.0650
学术水平
40 点
热心指数
40 点
信用等级
40 点
经验
475 点
帖子
49
精华
0
在线时间
600 小时
注册时间
2018-11-2
最后登录
2024-4-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

纳什均衡与帕累托最优是冲突的吗?

杨六省

对于囚徒困境,关于“在非零和博弈中纳什均衡概念与帕累托最优概念是冲突的”说法,笔者在“杨六省. 完整揭示纳什均衡概念的内涵及解决囚徒的困境[J]. 应用数学进展, 2018, 7(10): 1317-1324. http://www.hanspub.org/journal/AAM/ ”中一笔带过,这里细说一下。

由于人们的错误推理,得出了“认罪是每个囚徒的占优策略”的结论,从而,占优策略均衡(认罪,认罪),就应该是帕累托最优。

(认罪,认罪)是纳什均衡,这个结论没有错。但鉴于纳什均衡旧定义的内涵缺乏完整性,于是人们错误的认为,(认罪,认罪)是唯一的纳什均衡。根据上一段落的结论,这个唯一的纳什均衡就应该是帕累托最优,但明明不是——因为(认罪,认罪)这个策略组合还可以进行帕累托优化(注:帕累托优化(Pareto Improvement)的定义是:在没有使任何人境况变坏的前提下,使得至少一个人变得更好,是为帕累托优化,否则,就是帕累托最优状态),即两人都改变策略,都改为选择不认罪,就会使得双方都会有更好的收益。上述这个推理结论(指纳什均衡(认罪,认罪)应是帕累托最优)与客观存在(指策略组合(认罪,认罪)还可以进行帕累托优化)之间的矛盾,就是所谓的纳什均衡概念与帕累托最优概念的冲突。

综上所述,以往人们犯错的根源在于:①无效的推理得出了“认罪是每个囚徒的占优策略(最优策略)”这个错误的结论。②应用了纳什均衡概念的有缺陷的定义(指内涵是有缺失的)。只有消除了这两点,所谓“冲突”之说,自然就不复存在了:

①人们能够认识到,两个囚徒都应该选择“不认罪”策略(注:但不能说,“不认罪”策略是“占优策略”,因为“占优策略”这个概念含有对任何情况而言之意),因此,(不认罪,不认罪)应该是帕累托最优。根据纳什均衡新定义,(不认罪,不认罪)是纳什均衡,因此,就可以说,纳什均衡(不认罪,不认罪)是帕累托最优。

②(认罪,认罪)虽具有稳定性,但那是“纳什均衡”概念意义下的稳定性,而不是“帕累托最优”概念意义下的稳定性。前者是一般性概念,后者是特殊性概念。根据逻辑基本原理,特殊的是一般的(山羊是羊,白马是马),所以,“帕累托最优”概念意义下的稳定性(指具有终极意义的,即不可再优化的)就包含在“纳什均衡”概念意义下的稳定性之中,因此,就可以说,帕累托最优必是纳什均衡。

简言之,我们终于弄明白了,在囚徒困境博弈中,存在着一个特殊的纳什均衡(指(不认罪,不认罪))是帕累托最优,反过来说,帕累托最优必是某个纳什均衡。这个结论表明,纳什均衡概念与帕累托最优概念,并非是不相容的。

说明:诸位同好,欢迎您对我的关于囚徒困境的帖子给予批评和质疑。有什么不同意见和疑问尽管提出来,我们共同讨论,目的是把问题弄清。我既欢迎在论坛上讨论,也欢迎私下进行交流,我的邮箱是:yangls728@163.com


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
1993110 + 5 + 5 + 5 + 5 精彩帖子

总评分: 论坛币 + 5  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

沙发
frankyzj 发表于 2019-1-12 00:48:03 |只看作者 |坛友微信交流群
帕累托最优和纳什均衡是两种不同的分系框架下的均衡概念,二者之间没有必然的联系,严格的意义上说:帕累托最优是均衡的结果而并非均衡本身(纳什均衡是战略的均衡,在均衡战略的指导下选择相应的行动,参与人采取了行动而得到了一组行动的组合,在这一组行动组合下得到的支付结果,这才是我们看到的均衡的结果,换句话说,不同的战略组合可能得到相同结果),是从结果的角度看如果没有任何人愿意改变自己的行动而达到的结果,如果从博弈论分析方法看就是最终均衡结果的支付是不是达到了每个参与人是最优的,换句话说从最终的支付来看如果某一方能够通过改变自己的行动能够使自己的利益变得更好,说明存在帕累托改进的余地而没有达到帕累托最优,很显然囚徒困境肯定不是帕累托最优的,因为如果双方都坦白的情况下双方都抵赖就会使得双方的情况变好,说明存在帕累托改进的余地,只不过是在囚徒困境的博弈当中没有一种强有力的约束机制而保证双方都抵赖而已,这恰恰是博弈论当中的个体理性与集体理性相矛盾的地方,所以可以通过承诺行动或者是重复博弈来解决,而这个问题也是机制设计索要解决的一个方面。这主要是微观经济学分析的基本框架决定的,微观经济学分的基本框架实质上是一种倒推方式,即在一系列对于市场主体理性、市场结构、市场信息、市场行为等假定的前提下,根据观测到微观主体选择的行为(微观经济学的本质就是研究市场主体的选择行为,而选择又是一个复杂的心理活动,这这个活动是观测不到的)反推微观主体的选择行为,而帕累托最优实际上是在这些严格假设条件下理性经济人选择要实现的最终目标;在这个分析框架下一个很重要的假设就是所有的微观主体是在做决策,而不是在考虑对策,就是说每一个微观主体在进行选择的时候根本不用考虑自己的选择会对其他的人产生什么样的影响,完全是单纯从自身利益最大化的原则去考虑,也就是把其他人作为一个外生的参数来看待,为什么能这样?是因为每一个经济主体只能被动地去接受市场的均衡价格,而不能对市场的价格产生影响;而事实当中由于没有真正意义上的完全竞争市场,每一个市场参与者对市场的价格会有相当的影响力,所以每一个市场主体在进行选择时必定会考虑所做出的选择会对其他的市场主体产生什么样的影响,在进行选择的时候考虑的是对策而不是单纯的决策。这恰恰是博弈论研究的起点,也说明了为什么博弈论可以解释绝大多的市场现象。

使用道具

藤椅
eeabcde 发表于 2019-1-16 09:01:36 |只看作者 |坛友微信交流群
赞一个

使用道具

板凳
狂风吹裙子 发表于 2019-1-21 13:43:33 |只看作者 |坛友微信交流群
赞一个

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 12:05