|
因此,我们从附录中的推论A.1中得出一个元素(x)的存在性*, Y*) ∈ Z满足所有人(x,y)∈ Z不等式0=G((x)*, Y*), (十)*, Y*)) ≥ G((x)*, Y*), (x,y))=U(x,y*) - U(x)*, y) 和henceU(x,y*) ≤ U(x)*, y) 为了所有的x∈ X和所有y∈ Y这个是x*如果y玩家选择y,x玩家的最佳策略是什么*∈ Y同样地,y*对x是最优的*. 换句话说,(x*, Y*)是(X,Y,U)的平衡。定理3.1不仅在博弈论中,而且在一般的数学优化理论中都有重要的影响,我们将在下面的第4节中更详细地描述。为了说明这种情况,让我们首先看看rando在有限零和博弈中使战略决策最优化的特例。3.1. 简化了矩阵游戏。具有有限集X={1,…,m}的零和博弈eΓ=(X,Y,U)的效用U可以描述为amatrix U=[uij]∈ Rm×N,系数uij。这样的矩阵游戏并不一定承认公平。假设玩家随机选择各自的策略。也就是说,x-玩家决定x上的概率分布x,并选择一个i∈ X和概率XI。类似地,y-player在y上选择概率分布,并选择j∈ Y和p概率yj。然后x-player的预期增益isU(x,y)=mXi=1nXj=1ijxiyj。44 3. 零和GA MESSo我们得到一个零和博弈Γ=(X,Y,U),其中X是X上的概率分布集,X是概率分布集onY。X和Y是紧凸集(参见E X.3.3)。函数U在这两个分量中都是线性的,既凹又凸。因此,Γ是满足定理3假设的凸博弈。1因此允许一种平衡。这证明了冯·诺依曼的定理:定理3.2(冯·诺依曼)。让你∈ Rm×nbe系数为uij的任意矩阵。
|