楼主: Rothbardz
52361 12

[教与学] 如何求三个人的混合策略纳什均衡? [推广有奖]

  • 1关注
  • 2粉丝

硕士生

36%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0109
学术水平
0 点
热心指数
1 点
信用等级
-1 点
经验
1166 点
帖子
76
精华
0
在线时间
142 小时
注册时间
2009-1-25
最后登录
2013-4-5

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
比如A,B,C三个人,各有2个策略:A1,A2,B1,B2,C1,C2
收益矩阵如下
C1          B1           B2               C2      B1      B2  
A1     (4,5,3)       (3,2,5)           A1  (4,6,2)  (5,3,4)
A2     (5,3,2)       (5,4,4)           A2  (4,2,6)  (4,3,5)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:混合策略纳什均衡 纳什均衡 混合策略 博弈 如何 纳什均衡理论 混合策略纳什均衡 纯策略纳什均衡 贝叶斯纳什均衡 子博弈精炼纳什均衡 纳什均衡点

沙发
sailorwoods 发表于 2012-12-9 12:12:29 |只看作者 |坛友微信交流群
nash.png
混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。从上图可见,这个博弈没有纯策略的纳什均衡,所以我们只能去寻找混合策略的纳什均衡。假设在均衡状态下A,B,C三个参与者的混合策略分别是:A (a1,a2); B(b1,b2); C(c1,c2). 那么对不同参与者来说,在均衡状态下,不同纯策略的期望收益分别是:
参与者A:
EA1:   4*b1*c1+3*b2*c1+4*b1*c2+5*b2*c2;
EA2:   5*b1*c1+5*b2*c1+4*b1*c2+4*b2*c2;
参与者B:
EB1:   5*a1*c1+3*a2*c1+6*a1*c2+2*a2*c2;
EB2:   2*a1*c1+4*a2*c1+3*a1*c2+3*a2*c2;

参与者C:
EC1:   3*a1*b1+5*a1*b2+2*a2*b1+4*a2*b2;
EC2:   2*a1*b1+4*a1*b2+6*a2*b1+5*a2*b2;

突破点是参与者B的两个期望收益,
如果参与者B选择混合策略,有EB1=EB2,  即 3*a1*c1+3*a1*c2=a2*c1+a2*c2, 又c1+c2=1, 所以 3*a1=a2; 又因为a1+a2=1, 所以a1=0.25; a2=0.75. 此时参与者C的期望收益,EC1-EC2=a1*b1+a1*b2-4*a2*b1-a2*b2=0.25*(b1+b2)-3*a2*b1-a2*b1-a2*b2=0.25*(b1+b2)-3*a2*b1-0.75*(b1+b2)=-0.5-3*a2*b1<0.因此在B选择混合策略时,EC1<EC2, 参与者C会选择 C2. 至此,我们有:参与者A: (a1=0.25, a2=0.75); 参与者C:(c1=0, c2=1). 我们还需确B的策略, 把c1=0, c2=1 代入 EA1, EA2有 :EA1=4b1+5b2; EA2=4b1+4b2; 而A选择混合策略,所以EA1=EA2, 所以 4b1+5b2=4b1+4b2, 所以b2=0, b1=1. 也就是B选择(b1=1;b2=0). 所以这道题的混合策略纳什均衡是:
(A: (a1=0.25,a2=0.75), B: (b1=1, b2=0), C: (c1=0, c2=1)).  所以在参与者B选择混合策略的情况下,给定A和C的策略,B选B1(纯策略,b1=1,混合策略的特殊情况)是唯一符合条件的情况,而以上的均衡也是这个情况下唯一的均衡。
到此,唯一没有涵盖的情况是参与者B选择纯策略B2的情况(b1=0,b2=1),在这个情况下参与者A和C的期望收益分别是:
参与者A: EA1=3*c1+5*c2; EA2= 5*c1+4*c2。EA1=EA2,  又c1+c2=1, 所以有c1=1/3,c2=2/3.
参与者C: EC1=5*a1+4*a2; EC2= 4*a1+5*a2。 EC1=EC2,又a1+a2=1, 所以有a1=1/2,a2=1/2.
但是在这个情况下,代入参与者B:
EB1:   5*a1*c1+3*a2*c1+6*a1*c2+2*a2*c2;
EB2:   2*a1*c1+4*a2*c1+3*a1*c2+3*a2*c2。有 EB1=4; EB2=3, 所以EB1>EB2, 因此(b1=0,b2=1)不是对A(a1=1/2,a2=1/2)和C(c1=1/3,c2=2/3)策略的最优反应,所以参与者B选择纯策略B2的情况(b1=0,b2=1)下没有纳什均衡。
综上所述,这个博弈唯一的纳什均衡是:
(A: (a1=0.25,a2=0.75), B: (b1=1, b2=0), C: (c1=0, c2=1)).

已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
peakyin + 5 + 2 + 2 + 2 精彩帖子
bnuwwb + 100 + 100 + 2 + 5 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 105  学术水平 + 4  热心指数 + 7  信用等级 + 2   查看全部评分

使用道具

藤椅
xulc432 发表于 2012-12-9 21:08:16 |只看作者 |坛友微信交流群
哦,一起研究一下。

使用道具

板凳
Rothbardz 发表于 2012-12-10 18:53:53 |只看作者 |坛友微信交流群
sailorwoods 发表于 2012-12-9 12:12
混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。从上图可见,这个博弈 ...
太感谢您!
有个疑问
为什么从B开始入手?就是因为得出1/4的概率吗?
可不可以假定A或者C的期望报酬相等呢,这样a1就可能等于1或者0了?

使用道具

报纸
sailorwoods 发表于 2012-12-10 19:18:10 |只看作者 |坛友微信交流群
Rothbardz 发表于 2012-12-10 19:53
太感谢您!
有个疑问
为什么从B开始入手?就是因为得出1/4的概率吗?
是的,EA和 EC不能直接得出概率,EB可以。

使用道具

地板
sailorwoods 发表于 2012-12-10 19:21:51 |只看作者 |坛友微信交流群
Rothbardz 发表于 2012-12-10 19:53
太感谢您!
有个疑问
为什么从B开始入手?就是因为得出1/4的概率吗?
其实如果是混合策略均衡的话,如果没有占优策略,一般假设大家都使用混合策略,所以本身就需要在均衡情况下,所有参与者的不同策略的期望收益都相等。

使用道具

当C选择纯策略C1时,C1--->A2--->B2--->C2,无均衡
当A选择纯策略A1时,A1--->B1--->C1--->A2,无均衡
当A选择纯策略A2时,A2--->B2--->C2--->A1,无均衡

当B选择纯策略B2时,B2--->A1--->C1--->A2--->C2--->A1,形成循环
因此,B选择纯策略B2,可能形成三方的均衡.
设A1的概率为x,令:
5x+4(1-x)=4x+5(1-x)
解得:x=1/2
设C1的概率为y,令:
3y+5(1-y)=5y+4(1-y)
解得:y=1/3
检验:
B选择B2的期望为:2*1/2*1/3+3*1/2*2/3+4*1/2*1/3+3*1/2*2/3=3
此时B改变策略选B1的期望为:5*1/2*1/3+6*1/2*2/3+3*1/2*1/3+2*1/2*2/3=4
因此B会改变策略选B1。
达不到均衡。

当C选C2,A选A1是乎优于A2,但是当B选择纯策略B1时,A无论选什么策略,其收益都是4,可能存在均衡。
设A选A1的概率为x,令B选B1、B2的期望相等,有:
6x+2(1-x)=3x+3(1-x)
解得x=1/4
检验:
当A选混合策略A1=0.25,A2=0.75,B选纯策略B1时,C选C1、C2的期望分别为:
C1:3*1/4+2*3/4=9/4
C2:2*1/4+6*3/4=20/4
C选C2的期望更大,C不会改变策略。
即:
当A选混合策略A1=0.25,A2=0.75,B选纯策略B1时,C选纯策略C2时,达到均衡。
此解法不能排除三人都用混合策略达到均衡的可能性。

使用道具

又算了一下此博弈的纳什均衡:
设A选A1的概率为x,设B选B1的概率为y,设C选C1的概率为z。
令C选C1的期望等于选C2的期望,有:
3xy+5x(1-y)+2(1-x)y+4(1-x)(1-y)=2xy+4x(1-y)+6(1-x)y+5(1-x)(1-y)
化简:
3xy+5x-5xy+2y-2xy+4(1-x-y+xy)=2xy+4x-4xy+6y-6xy+5(1-x-y+xy)
-4xy+5x+2y+4-4x-4y+4xy=-8xy+4x+6y+5-5x-5y+5xy
x+4-2y=-3xy-x+y+5
2x-3y+3xy=1
令B选B1的期望等于选B2的期望,有:
5xz+6x(1-z)+3(1-x)z+2(1-x)(1-z)=2xz+3x(1-z)+4(1-x)z+3(1-x)(1-z)
化简:
5xz+6x-6xz+3z-3xz+2(1-x-z+xz)=2xz+3x-3xz+4z-4xz+3(1-x-z+xz)
-4xz+6x+3z+2-2x-2z+2xz=-5xz+3x+4z+3-3x-3z+3xz
-2xz+4x+z+2=-2xz+z+3
4x=1
x=1/4
那么,2x-3y+3xy=1,变成:
2*1/4-3y+3*1/4*y=1
解得y=-1/9
y为负数,说明C选混合策略是达不到均衡的,可能采用了纯策略。
当C采用纯策略C1时,A会改变为纯策略A2,达不到均衡。
当C采用纯策略C2时,A可能会改变为纯策略A1,要使A不改变策略,只能是当B选择纯策略B1时。
检验:
当A选混合策略A1=0.25,A2=0.75,B选纯策略B1时,C选C1、C2的期望分别为:
C1:3*1/4+2*3/4=9/4
C2:2*1/4+6*3/4=20/4
C选C2的期望更大,C不会改变策略。
当A选混合策略A1=0.25,A2=0.75,C选纯策略C2时,B选B1、B2的期望分别为:
B1:6*1/4+2*3/4=3
B2:3*1/4+3*3/4=3
B不会改变策略。
综上所述,当A选混合策略A1=0.25,A2=0.75,B选纯策略B1时,C选纯策略C2时,达到均衡。


使用道具

9
worex 发表于 2015-5-17 22:10:08 |只看作者 |坛友微信交流群
遇到师兄了,握个爪,正好也需要研究三个博弈方的混合纳什均衡解

使用道具

10
weimulu 发表于 2016-4-18 20:41:17 |只看作者 |坛友微信交流群
感谢!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 18:26