补充点博弈论的基础知识:
构建一个博弈,需要以下基本要素:
(1)局中人(参与者):
参与者是博弈中决策的主体,他是理性人,即总是选择他认为最有利于他自己的行为。每局博弈至少有两个参与者。有时,要引入一个特殊的参与者,自然(nature)。比如,一个人猜硬币,可以看成是你在和自然或上帝博弈。
(2)行动集(action set):
行动是参与人在博弈中的选择变量。规定每个参与者可以采取的行动的集合。比如,猜硬币博弈,一个人有两个行动可供选择:正面,反面。如果是两个硬币,则行动集中的行动增加一倍:(正面,正面),(正面,反面),(反面,正面),(反面,反面)。
(3)时序(playing sequence):
行动的顺序非常重要,如果博弈双方是同时行动或者等同于同时行动(即虽然后先后,但相互观察不到,则与同时形同没有区别),则称为静态博弈;如果行动有先后顺序,即有一方能够观测到对方的行动,则称为动态博弈。
(4)策略(strategies):
策略是局中人在一局博弈中的一套完整的行动计划,表明在某种情况下如何行动,也就是告诉局中人,在每一种可预见的情况下选择什么行动,也称为相机行动方案。策略与行动不同,策略包括信息。比如囚徒困境,每个局中人的行动只有两种:坦白,抵赖。但策略就包括:(坦白,抵赖)、(抵赖,抵赖)、(抵赖,坦白)、(坦白,坦白)四种。尽管最后的均衡是(坦白,坦白),但策略有四种。
(5)报酬(支付、收益)(payoffs):
局中人在不同情况下所得到的效用。报酬也叫做支付函数就是参与人的期望效用函数,即不同的战略组合下所获得的期望效用。
(6)信息(information):
局中人决策所依据的信息。信息是参与人的有关博弈的知识。这些知识主要是“自然”(指一个虚拟的参与人)的行动选择信息、参与人的战略空间和战略组合下的支付函数。
“完美信息”是指任何一个参与人对其他参与人的战略空间和战略组合下的支付函数、以及“自然”的行动选择都有准确的了解。
“完全信息”是指其参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解。“不完全信息”就是指有至少一个参与人的战略空间或支付函数不被别的参与人完全了解。
显然,不完全信息意味着不完美信息,但反之不成立。
还有一个与信息有关的重要概念——“共同知识”:它是指“所有的参与人知道,所有的参与人知道所有的参与人知道,所有的参与人知道所有的参与人知道所有的参与人知道·····”的知识。“共同知识”是博弈论中一个非常强的假定,它与“共同享有某种知识”不是同一个概念。也就是说,共同享有的知识,并不一定是“共同知识”。例如,A与B两个人,可能事实上都知道市场需求的情况,但A不一定了解B是否也知道这个情况,即使A知道B知道这个情况,也不一定知道B是否知道A知道这个情况,如此等等,要一直相互地知道下去直至无穷,才算是“共同知识”。
(7)结果(outcome):
结果是博弈分析者所感兴趣的所有东西,或者说,博弈分析者(建模者)从行动、支付和其他变量中所挑选出来的他感兴趣的要素的组合。比如,均衡战略组合,均衡行动组合,均衡支付组合等。
(8)均衡(equilibria):
均衡是所有局中人选取的最佳策略所组成的策略组合。
在上述要素中,局中人、行动集、时序、策略、报酬和信息规定了一局博弈的游戏规则。