楼主: johnyj
13147 37

[文献讨论] 从囚徒困境看博弈论的一厢情愿 [推广有奖]

  • 0关注
  • 0粉丝

高中生

32%

还不是VIP/贵宾

-

威望
0
论坛币
252 个
通用积分
0
学术水平
1 点
热心指数
4 点
信用等级
0 点
经验
207 点
帖子
35
精华
0
在线时间
8 小时
注册时间
2005-8-26
最后登录
2015-4-26

楼主
johnyj 发表于 2005-8-26 11:00:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

囚徒困境博弈

---------------------------------------------------------------- 塔克是从这样一个小故事开始的:两个夜贼,鲍伯(Bob)和艾尔(Al),在行窃现场附近被抓获并被警方隔离拷问。每个夜贼都必须选择是否坦白和揭发对方。如果两个贼都不坦白,他们都将被判刑一年。如果每个贼都坦白并揭发对方,他们都将在监狱中度过10年。但是,如果一个贼坦白并揭发对方,而另一个贼不坦白,那么与警方合作的贼将被释放而另一个贼将在监狱中度过20年。 在这个例子中的战略是:坦白与不坦白。赢利(payoff)(实际上是处罚)是判刑。我们可以用“赢利表(payoff table) ”简洁地表达上述信息,这类赢利表已经成为博弈论中很好的标准表达式。以下是囚徒困境博弈的赢利表。 表2-1              艾尔            坦白   不坦白 鲍伯   坦白   10,10   0,20      不坦白  20,0    1,1 这个表的读法是这样的:每个囚犯从两个战略中选择一个。即,艾尔选择一列,鲍伯选择一行。每个单元格的两个数字告诉两个囚犯相应的战略被选择后的结果。逗号左边的数字表示选择行的人(鲍伯)的赢利,逗号右边的数字表示选择列的人(艾尔)的赢利。因此(先阅读第一列),如果他们都选择坦白,每人将判刑10年,但是如果艾尔坦白而鲍伯不坦白,鲍伯被判20年而艾尔将被释放。 那么:怎样求解这个博弈?如果双方都想使自己呆在监狱的时间最短,他们选择什么战略是“理性的”?艾尔可能会做这样的推理:“两种事件可能发生:鲍伯要么坦白要么保持沉默。假定鲍伯坦白,我不坦白的话将被判20年,我也坦白的话则判10年。另一方面,如果鲍伯不坦白,我不坦白我被判刑1年,但在这种情况下,如果我坦白我可以被释放。无论怎样,我选择坦白都是最好的。因此,我将坦白。” 但是鲍伯能够而且大概也将做同样的推理——因此他们都将坦白并且都在监狱呆10年。然而,如果他们“不理性”地行动,都保持沉默,他们都可以在1年后被释放。 -----------------------------------------------------------------------------------------------

对于这个经典案例,很早就有人分析过,博弈论成立的基础是把别人当作傻瓜。那张赢利表是问题的关键:

             艾尔            坦白   不坦白 鲍伯   坦白   10,10   0,20      不坦白  20,0    1,1

根据这张表,我们假设囚犯会概率论(尽管这是比较荒唐的),以艾尔为例,可以看到如果选择坦白一列,可能的结果是10X50%+0X50%=5年,而不坦白一列,结果是20X50%+1X50%=10.5年。如果他会概率论,他就会选择坦白。可问题是他如果不会概率论呢?

又,假设警察告诉他们的是另一张表:

             艾尔            坦白   不坦白 鲍伯   坦白   20,20    0,10      不坦白  10,0    1,1

显然这时候两个人的选择都是不坦白,因为不坦白那一列的可能囚禁年数较少。

因此这张表才是问题的关键,作为会概率论的罪犯,他们的选择完全取决于这张表。因此对于象纳什那样既天真而又会概率论的囚徒,警察可以任意使用不同的表来获得自己想要的回答。

但事实是,这套把戏只能对付新手。稍微老道一点的囚徒,都会意识到这张表是问题的关键,在他们被捕之前,肯定已对于这张表或者说法律的程序了如指掌,因此无论警察如何套供,肯定是拒不承认。这一点,可以在众多香港影片中看到:黑帮被抓之后,都是死不认帐,最终获释,因为他们很清楚法律:在没有证据的情况下,是没有理由治罪的。

很多问题的关键不在博弈而在于信息优势,信息的多寡和力量的高低才是决定性的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:囚徒困境 博弈论 payoff Table 经典案例 博弈论 困境 囚徒 囚徒困境博弈 混沌理论 晕轮效应

已有 1 人评分学术水平 收起 理由
张漫浩 + 1 受教了。。。

总评分: 学术水平 + 1   查看全部评分

沙发
sunnygirl 发表于 2005-8-27 13:50:00
好东西
中国管理资讯整合网 www.69169.cn----管理知识网络图书馆, 行业分析|战略管理|市场营销|人力资源|管理工具|表格|咨询方案 大量免费的计划书、策划书、方案、报告下载。 欢迎访问!

藤椅
zhuangqian001 发表于 2005-8-27 18:53:00

晕..........

这个例子只是说明了一个分析事情的方法,你为什么会想到这件事情一定是在囚徒身上发生的。

你是否还想知道囚徒的名字、性别和国籍以判定事情的真实性?

板凳
johnyj 发表于 2005-8-27 21:49:00

是的,这仅仅是一个例子而已。

只是,这个例子暴露出了博弈论经不起推敲的特点。这个理论对于参与者的智力水平有一个基本的限定,也就是说:不能太傻,又不能太聪明,必须刚好这么聪明。如果这个假设不成立,那么博弈的过程就远比博弈论提到的要复杂。

多重博弈已经看到了这一面:想的每深入一层,作出的判断就截然相反,正好印证了佛教中“佛心自现”的说法。

可以拿博弈论比较一下孙子兵法,看看哪个更高一筹。

报纸
kennymb 发表于 2005-8-28 13:54:00

你这个例子并不能说明什么。在博弈论中开篇名义讲的很清楚,参与人的收益函数数值变化会影响博弈均衡结果。

第一张收益表是一个绝对优势策略均衡,只有唯一的囚徒困境结果。第二张收益表是个分级协调均衡,有三个均衡结果(包含一个混合均衡)。

你所说的力量高低,就反映在对参与人收益函数的变化上。

另外,博弈论证明了,信息多的一方并不一总意味着优势。想想单位分房,有个要求大房但又资格不够的职工是个非常冲动的人,放出话如果不满意就会拿刀砍人(往往这种都不是可置信威胁)。如果单位领导不知道这个信息,他就会把大房留给自己。相反,如果他知道这个信息,如果他无法判断此威胁是否可置信,他可能把大房分给职工。此时,信息对分房领导并不利。斯塔尔博格均衡和库诺均衡的区别也是说同一个例子。(参加张维迎:博弈论与信息经济学)

地板
0614 发表于 2005-8-28 17:54:00
高明啊

7
alfred5273 发表于 2005-9-24 11:25:00
用了心,但用心不够!吹毛求疵。

8
guodong 发表于 2005-9-25 11:31:00
个人看法:博弈论只是提供一种分析问题的工具,具体的模型建立在严格的假设下,提供一种衡量标尺。 不要为了博弈而博弈。
苏格拉底说,生活是哲学和怕老婆;邓小平说,生活就是人民;李敖说,生活就是不停的找茬;王晓波说,生活就是他妈的;我说,生活就是活着,以打发时间的方式。

9
sungmoo 发表于 2005-9-26 18:36:00
这个例子就是把博弈改成包括警察的三方博弈了。博弈树整个变了。

10
譬如朝露 发表于 2005-9-27 20:26:00

“囚徒困境”代表一种博弈的类型,当收益表中的数字对比关系发生改变的时候,博弈就不能再叫“囚徒困境”了,而是其他类型的博弈。

呵呵,还有人与偶争论过“囚徒困境”的假设条件不符合现行法律呢。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-24 19:30