如何求三个人的混合策略纳什均衡？

1关注
2粉丝

已卖：18份资源

硕士生

36%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 0 个
通用积分: 0.0109
学术水平: 0 点
热心指数: 1 点
信用等级: -1 点
经验: 1166 点
帖子: 76
精华: 0
在线时间: 142 小时
注册时间: 2009-1-25
最后登录: 2013-4-5

楼主

Rothbardz 发表于 2012-12-8 18:52:22 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

比如A,B,C三个人，各有2个策略：A1,A2,B1,B2,C1,C2
收益矩阵如下
C1       B1          B2             C2    B1    B2
A1    (4,5,3)    (3,2,5)          A1  (4,6,2)  (5,3,4)
A2    (5,3,2)    (5,4,4)          A2  (4,2,6)  (4,3,5)

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏21 回帖

关键词：混合策略纳什均衡纳什均衡混合策略博弈如何纳什均衡理论混合策略纳什均衡纯策略纳什均衡贝叶斯纳什均衡子博弈精炼纳什均衡纳什均衡点

相关帖子

沙发

sailorwoods 发表于 2012-12-9 12:12:29

混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。从上图可见，这个博弈没有纯策略的纳什均衡，所以我们只能去寻找混合策略的纳什均衡。假设在均衡状态下A,B,C三个参与者的混合策略分别是：A (a1,a2); B(b1,b2); C(c1,c2). 那么对不同参与者来说，在均衡状态下，不同纯策略的期望收益分别是：
参与者A:
EA1: 4*b1*c1+3*b2*c1+4*b1*c2+5*b2*c2;
EA2: 5*b1*c1+5*b2*c1+4*b1*c2+4*b2*c2;
参与者B:
EB1: 5*a1*c1+3*a2*c1+6*a1*c2+2*a2*c2;
EB2: 2*a1*c1+4*a2*c1+3*a1*c2+3*a2*c2;

参与者C:
EC1: 3*a1*b1+5*a1*b2+2*a2*b1+4*a2*b2;
EC2: 2*a1*b1+4*a1*b2+6*a2*b1+5*a2*b2;

突破点是参与者B的两个期望收益,
如果参与者B选择混合策略，有EB1=EB2,  即 3*a1*c1+3*a1*c2=a2*c1+a2*c2，又c1+c2=1, 所以 3*a1=a2；又因为a1+a2=1, 所以a1=0.25; a2=0.75. 此时参与者C的期望收益，EC1-EC2=a1*b1+a1*b2-4*a2*b1-a2*b2=0.25*(b1+b2)-3*a2*b1-a2*b1-a2*b2=0.25*(b1+b2)-3*a2*b1-0.75*(b1+b2)=-0.5-3*a2*b1<0.因此在B选择混合策略时，EC1<EC2, 参与者C会选择 C2. 至此，我们有:参与者A: (a1=0.25, a2=0.75); 参与者C:(c1=0, c2=1). 我们还需确B的策略，把c1=0, c2=1 代入 EA1, EA2有：EA1=4b1+5b2; EA2=4b1+4b2; 而A选择混合策略，所以EA1=EA2, 所以 4b1+5b2=4b1+4b2, 所以b2=0, b1=1. 也就是B选择(b1=1;b2=0). 所以这道题的混合策略纳什均衡是：
(A: (a1=0.25,a2=0.75), B: (b1=1, b2=0), C: (c1=0, c2=1)).  所以在参与者B选择混合策略的情况下，给定A和C的策略，B选B1（纯策略，b1=1，混合策略的特殊情况）是唯一符合条件的情况，而以上的均衡也是这个情况下唯一的均衡。
到此，唯一没有涵盖的情况是参与者B选择纯策略B2的情况(b1=0,b2=1)，在这个情况下参与者A和C的期望收益分别是：
参与者A: EA1=3*c1+5*c2; EA2= 5*c1+4*c2。EA1=EA2,  又c1+c2=1, 所以有c1=1/3,c2=2/3.
参与者C: EC1=5*a1+4*a2; EC2= 4*a1+5*a2。 EC1=EC2,又a1+a2=1, 所以有a1=1/2,a2=1/2.
但是在这个情况下,代入参与者B:
EB1: 5*a1*c1+3*a2*c1+6*a1*c2+2*a2*c2;
EB2: 2*a1*c1+4*a2*c1+3*a1*c2+3*a2*c2。有 EB1=4; EB2=3, 所以EB1>EB2, 因此(b1=0,b2=1)不是对A(a1=1/2,a2=1/2)和C(c1=1/3,c2=2/3)策略的最优反应，所以参与者B选择纯策略B2的情况(b1=0,b2=1)下没有纳什均衡。
综上所述，这个博弈唯一的纳什均衡是：
(A: (a1=0.25,a2=0.75), B: (b1=1, b2=0), C: (c1=0, c2=1)).

已有 2 人评分	经验	论坛币	学术水平	热心指数	信用等级	收起理由
peakyin		+ 5	+ 2	+ 2	+ 2	精彩帖子
bnuwwb	+ 100	+ 100	+ 2	+ 5		热心帮助其他会员

总评分: 经验 + 100 论坛币 + 105 学术水平 + 4 热心指数 + 7 信用等级 + 2 查看全部评分

藤椅

xulc432 发表于 2012-12-9 21:08:16

哦，一起研究一下。

板凳

Rothbardz 发表于 2012-12-10 18:53:53

sailorwoods 发表于 2012-12-9 12:12
混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。从上图可见，这个博弈 ...

太感谢您！
有个疑问
为什么从B开始入手？就是因为得出1/4的概率吗？
可不可以假定A或者C的期望报酬相等呢，这样a1就可能等于1或者0了？

报纸

sailorwoods 发表于 2012-12-10 19:18:10

Rothbardz 发表于 2012-12-10 19:53
太感谢您！
有个疑问
为什么从B开始入手？就是因为得出1/4的概率吗？

是的，EA和 EC不能直接得出概率，EB可以。

地板

sailorwoods 发表于 2012-12-10 19:21:51

Rothbardz 发表于 2012-12-10 19:53
太感谢您！
有个疑问
为什么从B开始入手？就是因为得出1/4的概率吗？

其实如果是混合策略均衡的话，如果没有占优策略，一般假设大家都使用混合策略，所以本身就需要在均衡情况下，所有参与者的不同策略的期望收益都相等。

7楼

小三真子的圣衣 发表于 2012-12-12 02:12:31

当C选择纯策略C1时,C1--->A2--->B2--->C2,无均衡
当A选择纯策略A1时,A1--->B1--->C1--->A2,无均衡
当A选择纯策略A2时,A2--->B2--->C2--->A1,无均衡

当B选择纯策略B2时,B2--->A1--->C1--->A2--->C2--->A1,形成循环
因此,B选择纯策略B2,可能形成三方的均衡.
设A1的概率为x,令:
5x+4(1-x)=4x+5(1-x)
解得:x=1/2
设C1的概率为y,令:
3y+5(1-y)=5y+4(1-y)
解得:y=1/3
检验:
B选择B2的期望为:2*1/2*1/3+3*1/2*2/3+4*1/2*1/3+3*1/2*2/3=3
此时B改变策略选B1的期望为:5*1/2*1/3+6*1/2*2/3+3*1/2*1/3+2*1/2*2/3=4
因此B会改变策略选B1。
达不到均衡。

当C选C2，A选A1是乎优于A2，但是当B选择纯策略B1时,A无论选什么策略,其收益都是4，可能存在均衡。
设A选A1的概率为x，令B选B1、B2的期望相等，有：
6x+2(1-x)=3x+3(1-x)
解得x=1/4
检验：
当A选混合策略A1=0.25，A2=0.75，B选纯策略B1时，C选C1、C2的期望分别为：
C1：3*1/4+2*3/4=9/4
C2：2*1/4+6*3/4=20/4
C选C2的期望更大，C不会改变策略。
即：
当A选混合策略A1=0.25，A2=0.75，B选纯策略B1时，C选纯策略C2时，达到均衡。
此解法不能排除三人都用混合策略达到均衡的可能性。

8楼

小三真子的圣衣 发表于 2012-12-16 22:29:04

又算了一下此博弈的纳什均衡:
设A选A1的概率为x,设B选B1的概率为y，设C选C1的概率为z。
令C选C1的期望等于选C2的期望，有：
3xy+5x(1-y)+2(1-x)y+4(1-x)(1-y)=2xy+4x(1-y)+6(1-x)y+5(1-x)(1-y)
化简:
3xy+5x-5xy+2y-2xy+4(1-x-y+xy)=2xy+4x-4xy+6y-6xy+5(1-x-y+xy)
-4xy+5x+2y+4-4x-4y+4xy=-8xy+4x+6y+5-5x-5y+5xy
x+4-2y=-3xy-x+y+5
2x-3y+3xy=1
令B选B1的期望等于选B2的期望，有：
5xz+6x(1-z)+3(1-x)z+2(1-x)(1-z)=2xz+3x(1-z)+4(1-x)z+3(1-x)(1-z)
化简:
5xz+6x-6xz+3z-3xz+2(1-x-z+xz)=2xz+3x-3xz+4z-4xz+3(1-x-z+xz)
-4xz+6x+3z+2-2x-2z+2xz=-5xz+3x+4z+3-3x-3z+3xz
-2xz+4x+z+2=-2xz+z+3
4x=1
x=1/4
那么，2x-3y+3xy=1，变成:
2*1/4-3y+3*1/4*y=1
解得y=-1/9
y为负数，说明C选混合策略是达不到均衡的，可能采用了纯策略。
当C采用纯策略C1时，A会改变为纯策略A2，达不到均衡。
当C采用纯策略C2时，A可能会改变为纯策略A1，要使A不改变策略，只能是当B选择纯策略B1时。
检验：
当A选混合策略A1=0.25，A2=0.75，B选纯策略B1时，C选C1、C2的期望分别为：
C1：3*1/4+2*3/4=9/4
C2：2*1/4+6*3/4=20/4
C选C2的期望更大，C不会改变策略。
当A选混合策略A1=0.25，A2=0.75，C选纯策略C2时，B选B1、B2的期望分别为：
B1：6*1/4+2*3/4=3
B2：3*1/4+3*3/4=3
B不会改变策略。
综上所述，当A选混合策略A1=0.25，A2=0.75，B选纯策略B1时，C选纯策略C2时，达到均衡。

9楼

worex 发表于 2015-5-17 22:10:08

遇到师兄了，握个爪，正好也需要研究三个博弈方的混合纳什均衡解

10楼

weimulu 发表于 2016-4-18 20:41:17

感谢！

[教与学] 如何求三个人的混合策略纳什均衡？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[教与学] 如何求三个人的混合策略纳什均衡？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群