|
扰动博弈的Berk-Nash均衡的定义与定义1相似,唯一的区别是扰动博弈必须要求最优性。4.2学习基础我们假设一个受干扰的游戏,并假设玩家在每个t=0,1,2。。。,其中,时间-t状态和信号(ωt,st)以及扰动ξt分别从相同分布P和Pξ的每个周期中独立绘制。此外,每个玩家i都有一个先前的ui,完全支持她的(有限维)参数集Θi。在每个时段t结束时,每个玩家都使用贝叶斯规则和在过去所有时段获得的信息(她自己的信号、行动和后果)来更新信念。玩家认为他们面临着一个稳定的环境,目光短浅地最大化了当前时期的预期收益。允许(Θi)表示Θi上完全支持的概率分布集。莱比:(Θi)×Si×Xi×Yi→ (Θi)表示参与者i的贝叶斯算子:总之,我们将注意力限制在参数模型(即有限维参数空间)上,因为,否则,在正确指定的统计设置中,对于大多数先验和参数值7,贝叶斯更新不必收敛到真理(Freedman(1963)、Diaconis和Freedman(1986))。A. ΘBorel可测量和全部(ui、si、xi、yi)∈ (Θi)×Si×Xi×Yi,Bi(ui,Si,Xi,Yi)(A)='AQiθi(Yi | Si,Xi)ui(dθ)'Qiθi(Yi | Si,Xi)ui(dθ)。假设1很好地定义了贝叶斯更新。因为玩家相信他们面对的是一个带有i.i.d.扰动的静止环境,所以限制玩家i在时间t的行为(uit,sit,ξit)不失普遍性。定义5。参与方i的策略是一系列函数φi=(φit)t,其中φit:(Θi)×Si×Ξi→ xi如果φ为,则策略φ为最优∈ ψ对于所有t。
|