|
对于(τ,γθ)∈ T×TθRandД=π/(1)- π) ,设usdenotebJx,Д(τ,γθ):=(1+Д)Jx,π(τ,γθ)。(29)下一个结果将事先版本的游戏的鞍点与其临时版本的纳什均衡联系起来(与[24]中的精神相同)。提案3.6。Let(x,ν)∈ 给出I×R+。随机停止对(τ*, γ*θ) ∈ 事前博弈中的T×TθRisa鞍点(定义2.4)当且仅当它是代理形式博弈中的纳什均衡。也就是说,当且仅当*,0, Γ*,1) ∈ A×A是生成γ的偶*θ、 我们有(30)Jx,ν(τ*, Γ*,0) ≤ Jx,Д(τ*, Γ),(31)Jx,Д(τ)*, Γ*,1) ≤ Jx,Д(τ*, Γ)和(32)bJx,Д(τ,γ*θ) ≤bJx,Д(τ*, γ*θ) 对于所有随机停止对(τ,Γ)∈ T×Aθ。证据我们从(26)中得出,ρ(τ,γθ)=Jx,Д(τ,Γ)+ДJx,Д(τ,Γ)。(33)由此可知,知情玩家的策略Γ=(Γ,Γ)最小化Sbjx,Д(τ*, γθ)当且仅当Γ和Γ最小化Jx,Д(τ*, Γ)和Jx,Д(τ*, Γ),分别。相反,条件(32)与定义2.4中的相同。对于纳什均衡(τ*, γ*θ) 我们参考tobJx,Д(τ*, γ*θ) ,Jx,Д(τ*, Γ*,0)和Jx,Д(τ*, Γ*,1) 作为相应的平衡报酬s.12 TIZIANO DE ANGELIS,ERIK Ekstrom和Kristofer GLOVERRemark 3.7。我们观察到,命题3.6将这场游戏解释为一名门将和两名控制员之间的三人非零和游戏。请注意,挡块同时对两个控制器进行比赛,而每个控制器仅对挡块进行比赛。这与不完全信息博弈的经典结果是一致的(见[24]或[1])。
|