混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。从上图可见,这个博弈没有纯策略的纳什均衡,所以我们只能去寻找混合策略的纳什均衡。假设在均衡状态下A,B,C三个参与者的混合策略分别是:A (a1,a2); B(b1,b2); C(c1,c2). 那么对不同参与者来说,在均衡状态下,不同纯策略的期望收益分别是:
参与者A:
EA1: 4*b1*c1+3*b2*c1+4*b1*c2+5*b2*c2;
EA2: 5*b1*c1+5*b2*c1+4*b1*c2+4*b2*c2;
参与者B:
EB1: 5*a1*c1+3*a2*c1+6*a1*c2+2*a2*c2;
EB2: 2*a1*c1+4*a2*c1+3*a1*c2+3*a2*c2;
参与者C:
EC1: 3*a1*b1+5*a1*b2+2*a2*b1+4*a2*b2;
EC2: 2*a1*b1+4*a1*b2+6*a2*b1+5*a2*b2;
突破点是参与者B的两个期望收益,
如果参与者B选择混合策略,有EB1=EB2, 即 3*a1*c1+3*a1*c2=a2*c1+a2*c2, 又c1+c2=1, 所以 3*a1=a2; 又因为a1+a2=1, 所以a1=0.25; a2=0.75. 此时参与者C的期望收益,EC1-EC2=a1*b1+a1*b2-4*a2*b1-a2*b2=0.25*(b1+b2)-3*a2*b1-a2*b1-a2*b2=0.25*(b1+b2)-3*a2*b1-0.75*(b1+b2)=-0.5-3*a2*b1<0.因此在B选择混合策略时,EC1<EC2, 参与者C会选择
C2. 至此,我们有:参与者A: (a1=0.25, a2=0.75); 参与者C:(c1=0, c2=1). 我们还需确B的策略, 把c1=0, c2=1 代入 EA1, EA2有 :EA1=4b1+5b2; EA2=4b1+4b2; 而A选择混合策略,所以EA1=EA2, 所以 4b1+5b2=4b1+4b2, 所以b2=0, b1=1. 也就是B选择(b1=1;b2=0). 所以这道题的混合策略纳什均衡是:
(A: (a1=0.25,a2=0.75), B: (b1=1, b2=0), C: (c1=0, c2=1)). 所以在
参与者B选择混合策略的情况下,给定A和C的策略,B选B1(纯策略,b1=1,混合策略的特殊情况)是唯一符合条件的情况,而以上的均衡也是这个情况下唯一的均衡。
到此,唯一没有涵盖的情况是
参与者B选择纯策略B2的情况(b1=0,b2=1),在这个情况下参与者A和C的期望收益分别是:
参与者A: EA1=3*c1+5*c2; EA2= 5*c1+4*c2。EA1=EA2, 又c1+c2=1, 所以有c1=1/3,c2=2/3.
参与者C: EC1=5*a1+4*a2; EC2= 4*a1+5*a2。 EC1=EC2,又a1+a2=1, 所以有a1=1/2,a2=1/2.
但是在这个情况下,代入参与者B:
EB1: 5*a1*c1+3*a2*c1+6*a1*c2+2*a2*c2;
EB2: 2*a1*c1+4*a2*c1+3*a1*c2+3*a2*c2。有 EB1=4; EB2=3, 所以EB1>EB2, 因此
(b1=0,b2=1)不是对A(a1=1/2,a2=1/2)和C(c1=1/3,c2=2/3)策略的最优反应,所以参与者B选择纯策略B2的情况(b1=0,b2=1)下没有纳什均衡。
综上所述,这个博弈唯一的纳什均衡是:
(A: (a1=0.25,a2=0.75), B: (b1=1, b2=0), C: (c1=0, c2=1)).