比如在静态贝叶斯博弈G={A1,…,An; T1,…,Tn; p1,…,pn; u1,…,un}中,考虑贝叶斯纳什均衡s*=(s1*,…,sn*)。我们将构建一个“说实话”均衡的直接机制来重新表述s*。
这个直接机制和G有着一样的类型空间和概率推断,但是行动空间和收益函数不一样(行动空间就是他的类型空间),关键是运用原博弈G的均衡s*来保证“说实话”是该直接机制的均衡解。
因为s*是G的贝叶斯纳什均衡,所以任意一位参与者i的任意类型ti∈Ti,si*(ti)为i面对其他参与者的策略组合(s1*,…, si-1*, si+1*,…,sn*)时的最优反应。
由此,我们来确定直接机制中的得益函数。将参与者关于类型的声明τ=(τ1,…,τn)代入原博弈的均衡策略s*中,来计算i的收益函数如下:
vi*(τ, t)=ui[s*(τ), t],其中t=(t1,…,tn)
也就是说,参与人声明类型τ,我们把这个当做其真实类型,按照原博弈就应该选择最优策略s*(τ),从而给定这样的策略组合,并根据其真是类型t获得收益ui[s*(τ), t],这个收益便对应了“直接机制”中的类型声明τ。
然后,我们要证明τ=t是该“直接机制”的贝叶斯纳什均衡。
一旦参与者声明了类型τi,就相当于选择了si*(τi)。也就是说,若给定其他人也选择说实话的时候,参与人i面临的其他人的策略组合是(s1*,…, si-1*, si+1*,…,sn*),根据条件,si*(ti)是其最优反应,对于其所有可能的类型i而言。也就是说,参与人i会选择si*(ti),即选择声明τi=ti。
得证。
|