|
纳什均衡被恢复为一个表示决策不确定性趋向于确定性的参数,因此纳什均衡是QRE给出的已执行点的子集。有几种不同的方法可以得出QRE,McKelvey和Palfreyused的不同拓扑以及其中一位作者最近的工作使用了最大熵的方法【46,22】。出于我们的目的,我们将简单地定义相关术语,并说明QRE的逻辑功能形式。我们注意到,这种形式的QRE通信并没有什么特殊之处。可以预期,本文中的所有工作,尤其是由噪声项β参数化的分岔分析,都将延伸到任何常规QRE函数形式。代理i的预期效用gi(pi,p-i) 可以说是以i的离散选择cji:gi(p-i | cji)。gi(p)的解释-i | cji)是指,如果代理人i选择SECJI,即他们fix pji=1,而所有其他代理人保持(可能混合)联合战略,则这是代理人i的预期效用p-i、 QRE给出的平衡点定义为联合分布(p*, . . . , p*n) 给出人:p*i(cji |βi)=exp(βigi(p*-i | cji)Pjexp(βigi(p*-i | cji))(22)这满足了agent i的j选择空间的概率分布标准和指数函数βigi(p*-i | cji)是每种药剂的控制参数βi和梯度gi(p*-i | cji),参考方程式18-20。参数βi∈ [0, ∞] 控制代理在选择每个策略时的噪音或不确定性水平,当βi=0时,代理在其选择中进行统一选择,当βi→ ∞ 恢复了博弈的纳什均衡。
|