楼主: ungaria
5420 26

[教与学] 博弈菜鸟求助 [推广有奖]

  • 0关注
  • 0粉丝

已卖:194份资源

本科生

86%

还不是VIP/贵宾

-

威望
0
论坛币
623 个
通用积分
0.6350
学术水平
3 点
热心指数
3 点
信用等级
2 点
经验
905 点
帖子
63
精华
0
在线时间
152 小时
注册时间
2009-2-11
最后登录
2016-11-29

楼主
ungaria 发表于 2010-2-17 16:05:33 |AI写论文
50论坛币
3个players, 用pure strategy, perfect information.
player 1(U,D), player 2(L,R), player 3(A,B)

如果player 3 选 A
那payoff的表格如下{ (2,2,0) 代表 player 1's payoff is 2, player 2's payoff is 2, player 3's payoff is 0, etc.}
     L        R
U |2,2,0| 5,5,5|
D |8,6,8|0,7,4|
如果player 3选 B
那payoff是
        L       R
U| 4,4,1|4,2.8|
D|0,2,9|4,2,5|


问nash均衡是什么
如果把这个game玩2次,那么subgame perfect equilibrium有哪些些啊

非常感谢..
我纠结的地方在于,很显然从payoff的角度, player 3应该选B, 但是如果他选B, 结果肯定是 4,4,1..他payoff是1..如果选 A, 他payoff在nash均衡下,是5..但是怎么知道别的player会选什么...
如果重复2次就更不知道怎么回事了...
问题比较幼稚.忘各位大侠给点帮助.谢谢!!!!

update:  我想明白nash均衡应该是 U,L,B 和 D,R,B..
我觉得 subgame perfect equilibrium是 4个
(U,L,B;U,L,B),
(D,R,B,D,R,B)
,(D,R,B;U,L,B)
,(U,L,B;D,R,B)
也就是nash均衡的 排列组合..

麻烦大家给验证一下?

这个作业北京时间 周五凌晨4点要交..(好吧,我是问作业的,羞愧~~...!谢谢大家了)

update:
last minute 想到一种策略.
第一轮, 3个人说好:玩 5,5,5 的那个策略. 第二轮, 如果在前一轮所有人都玩5,5,5,了,那就玩 4,2,5. 如果,有人deviate, 就玩4,4,1.
我看了下, no one can be better off by deviating..
---------------------------------------------------------------------------------------------------------------------------------
作业已交..感谢大家的热心帮助..我能把这个50个论坛币分给好几个人麽...虽然知道本来就没多少..............

最佳答案

七彩瑜 查看完整内容

哈哈,我被表扬了.翻滚一下.. 谢谢对于pareto上策均衡的解释. 这个我之前不知道. 不过是不是如果出现pareto上策均衡的NE,其他 NE在game中,就无出现的可能性? [/quote] 当然有可能出现,pareto上策的性质使得这一均衡更为稳定,因而更容易达到,而不是说它必然实现。
关键词:equilibrium information Informatio formation deviating 求助 博弈 菜鸟
已有 1 人评分学术水平 收起 理由
七彩瑜 + 1 正解!

总评分: 学术水平 + 1   查看全部评分

沙发
七彩瑜 发表于 2010-2-17 16:05:34
ungaria 发表于 2010-2-20 03:16
七彩瑜 发表于 2010-2-19 22:41
楼主有才!的确存在trigger strategy SPNE。对于两个NE,原博弈存在两个能使payoff(相对于两个NE)pareto改进的策略,即(U,R,A)与(D,L,A),对应payoff(5,5,5)与(8,6,8)。对于后者,第一轮P2、P3都有可能deviate,而考虑到两个NE的payoff性质不能同时对P2、P3两人惩罚,故不构成trigger strategy;对于前者,第一轮只有P3有deviate的动机,且第一轮deviate的额外获益是8-5=3,而第二轮对之进行惩罚令其损失5-1=4,故存在这样一个trigger strategy SPNE:第一轮如果是(U,R,A),则第二轮(D,R,B);第一轮如果不是(U,R,A),则第二轮(U,L,B)。如楼主所言。
PS:剔除强劣策略在重复博弈的分析下可能造成误判。
PS2:帕累托上策均衡是指,数个NE中的某个NE相对于其他NE,每个player的payoff有增无减,则这一NE更有可能成为博弈的结果。
PS3:画extensive form无助于解题。
哈哈,我被表扬了.翻滚一下..

谢谢对于pareto上策均衡的解释. 这个我之前不知道. 不过是不是如果出现pareto上策均衡的NE,其他 NE在game中,就无出现的可能性?
当然有可能出现,pareto上策的性质使得这一均衡更为稳定,因而更容易达到,而不是说它必然实现。
It's not who I am underneath but what I do that defines me.

藤椅
mustangGTR 发表于 2010-2-17 16:34:22
最好是能把normal form或者extensive form贴上来,这样比较直观。
看楼主的描述感觉糊里糊涂的

板凳
ungaria 发表于 2010-2-17 16:54:00
更新了.希望更清楚. 谢谢

报纸
白痴不二 发表于 2010-2-18 07:33:32
哈哈,LZ的题目好像我也有印象了。最近我也在学Game Theory~~

我建议楼主去看Yale 的Game Theory的本科课程,免费的。我都看了好多个了,终于搞懂NE,SPE之类的感念了~~

至于你的题目,其实我是看不懂你的表述是什么啦.....

地板
mustangGTR 发表于 2010-2-18 08:18:06
恩,是清晰多了。我再确认一下楼主的题目,第一个node是player3是吧?然后L,R那个node是谁选择的?U,D node是谁选择的?这两个node很关键,得知道这两个node是谁选的才能找到这些subgame 的NE。目前我认为楼主的这道题是perfect information对吗?那就是说有一共有7个subgames了?

提醒楼主一下:twice repeated game其实不难,关键是把extensive form给画出来,那样就清晰了。至于这道题么,估计楼主得画一张纸了,哈哈

7
mustangGTR 发表于 2010-2-18 08:21:06
还有一个问题,楼主的twice repeated 这个问题应该是有discount rate的吧?

博弈论我也学了好久了,隐约记得好像是应该有discount rate

8
ungaria 发表于 2010-2-18 12:41:16
5# mustangGTR
hello,

是perfect information.. U,D是 player 1.. LR是player 2. (payoff的顺序是按照player 1,2,3 这样)

是哪7个啊,我只找出了4个..
我有画extensive form.. 给你讲下思路..能看看对不对吗?

第二次玩,一定是nash均衡的结果.. 所以把nash均衡的payoff(4,4,1 和4,2,5)加到2个payoff matrix 里,看有没新的nash均衡..这道题..没有貌似.

非常谢谢你!

9
ungaria 发表于 2010-2-18 12:42:21
mustangGTR 发表于 2010-2-18 08:21
还有一个问题,楼主的twice repeated 这个问题应该是有discount rate的吧?

博弈论我也学了好久了,隐约记得好像是应该有discount rate
不考虑discount rate..

10
ungaria 发表于 2010-2-18 12:43:47
白痴不二 发表于 2010-2-18 07:33
哈哈,LZ的题目好像我也有印象了。最近我也在学Game Theory~~

我建议楼主去看Yale 的Game Theory的本科课程,免费的。我都看了好多个了,终于搞懂NE,SPE之类的感念了~~

至于你的题目,其实我是看不懂你的表述是什么啦.....
我去年听那个了.. 那个老头英国口音,好可爱.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 22:58