楼主: ungaria
5408 26

[教与学] 博弈菜鸟求助 [推广有奖]

21
ungaria 发表于 2010-2-19 10:46:49
liming_xue 发表于 2010-2-18 18:48
我是来学习的!
我也是:D

22
ungaria 发表于 2010-2-19 10:48:58
在水一方1989 发表于 2010-2-18 19:21
我认为这个三方博弈中,player 3之所以会选择B ,首先从纳什均衡的角度B是纳什均衡中的选择,其次他是因为想获得5个得益,他想赌一把。而就这个问题本身来说,如果是一次博弈,那么两个纳什均衡都是有可能出现的,结果也并不一定是(U,L,B),因为对player 1来说,他选U,D都一样,并没有必要为了player 2来选U以实现双方都能得4个得益,我想这是楼主不明白的地方。

至于重复两次的博弈,学过太久不太记得了,但是我觉得肯定不是两次纳什均衡的组合这么简单的,可能会用到触发策略或者一报还一报策略之类的,都不太记得了~~书也没带回来~不好意思帮不上忙了咯~
OK. 触发策略或者一报还一报策略,我最后一分钟想到了一个一报还一报策略. 不知道答全了没, 不过尽力而为了. 谢谢回答,第一段讲的很明白.

23
ungaria 发表于 2010-2-19 10:50:37
七彩瑜 发表于 2010-2-18 17:54
找NE可用三维矩阵的划线法,第一个数值纵向比较,第二个数值横向比较,第三个数值两表对应比较。事实上,如果留意到B是P3的严格优势策略,原题则可化简成双人博弈。LZ给出的NE是正解,SPNE也不错。如果要进一步深入分析实现均衡的可能性,注意到(U,L,B)是帕累托上策与风险上策均衡,且对于均衡(D,R,B),P1、P2中一方偏离时没有损失,可判定前者是最有可能的结果。由于不存在触发与轮换的可能,两次重复博弈也是如此逻辑。
谢谢回答!  帕累托上策是什么.....

24
ungaria 发表于 2010-2-19 10:56:00
jgzyz 发表于 2010-2-18 17:39
关于这个博弈的次数,我个人认为无关大局:一方面,对于有限次博弈而言,博弈重复的次数应该对结果没有什么影响;另一方面,如果局中人具有记忆的话,也就是说能够对上一次博弈中其他局中人的选择有学习的话,在这个博弈里也不会影响博弈的结果!
以上仅是个人的一点不成熟的思考,仅供参考!
HEY!! 谢谢你帮忙, 刚刚楼上有人提到所谓一报还一抱策略,是不是在有限次博弈里也有可能呢? 我今天交作业之前,想到 如果第一轮, 3个人说好:玩 5,5,5 的那个策略. 第二轮, 如果在前一轮所有人都玩5,5,5,了,那就玩 4,2,5. 如果,有人deviate, 就玩4,4,1.. 不知道对不对, 我check了一下,每个人deviate的payoff都不如不deviate.所以这是不是也是一种subgame perfect eq 呢?

25
七彩瑜 发表于 2010-2-19 22:41:55
楼主有才!的确存在trigger strategy SPNE。对于两个NE,原博弈存在两个能使payoff(相对于两个NE)pareto改进的策略,即(U,R,A)与(D,L,A),对应payoff(5,5,5)与(8,6,8)。对于后者,第一轮P2、P3都有可能deviate,而考虑到两个NE的payoff性质不能同时对P2、P3两人惩罚,故不构成trigger strategy;对于前者,第一轮只有P3有deviate的动机,且第一轮deviate的额外获益是8-5=3,而第二轮对之进行惩罚令其损失5-1=4,故存在这样一个trigger strategy SPNE:第一轮如果是(U,R,A),则第二轮(D,R,B);第一轮如果不是(U,R,A),则第二轮(U,L,B)。如楼主所言。
PS:剔除强劣策略在重复博弈的分析下可能造成误判。
PS2:帕累托上策均衡是指,数个NE中的某个NE相对于其他NE,每个player的payoff有增无减,则这一NE更有可能成为博弈的结果。
PS3:画extensive form无助于解题。
It's not who I am underneath but what I do that defines me.

26
ungaria 发表于 2010-2-20 03:16:29
七彩瑜 发表于 2010-2-19 22:41
楼主有才!的确存在trigger strategy SPNE。对于两个NE,原博弈存在两个能使payoff(相对于两个NE)pareto改进的策略,即(U,R,A)与(D,L,A),对应payoff(5,5,5)与(8,6,8)。对于后者,第一轮P2、P3都有可能deviate,而考虑到两个NE的payoff性质不能同时对P2、P3两人惩罚,故不构成trigger strategy;对于前者,第一轮只有P3有deviate的动机,且第一轮deviate的额外获益是8-5=3,而第二轮对之进行惩罚令其损失5-1=4,故存在这样一个trigger strategy SPNE:第一轮如果是(U,R,A),则第二轮(D,R,B);第一轮如果不是(U,R,A),则第二轮(U,L,B)。如楼主所言。
PS:剔除强劣策略在重复博弈的分析下可能造成误判。
PS2:帕累托上策均衡是指,数个NE中的某个NE相对于其他NE,每个player的payoff有增无减,则这一NE更有可能成为博弈的结果。
PS3:画extensive form无助于解题。
哈哈,我被表扬了.翻滚一下..

谢谢对于pareto上策均衡的解释. 这个我之前不知道. 不过是不是如果出现pareto上策均衡的NE,其他 NE在game中,就无出现的可能性?

27
shelly_h 发表于 2010-11-8 08:57:32
支持一下~~·

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-31 17:41