这是个典型的针锋相对博弈。首先看支付矩阵,可以发现,C的最佳选择是随着R的选择而变化,因此有两个均衡(50,-50),(20,-20)。可以发现,只要R选择向那一边射门,那么C的最佳选择就是向那一边扑救。这样才能保证C的预期收益最大化——或者说预期损失最小化。
在加入概率p之后,就变成了混合博弈,但其策略是一样的——纯策略博弈是混合策略博弈的一种特殊情况。图中反应的是R的收益,因此,C只有在R收益最小化的情况下才能保证自己损失的最小化。那么可以看到,当p<0.7时,C的最优策略是扑向左方;相反则扑向右方。


雷达卡



京公网安备 11010802022788号







