|
指示符函数I(suI,su(t))可以由相应的混合策略组件代替,例如I(sR,sR(t))→ x(t)。可以组合等式。(4) 和(5)来表示x(t),y(t)的闭映射。x(t+1)=x(t)1-αeβИκ[δ+(1-δ) x(t)]∏R(y(t))x(t)1-αeβИκ[δ+(1-δ) x(t)]∏R(y(t))+(1-x(t))1-αeβИκ[δ+(1-δ) (1)-x(t))]πR(y(t)),y(t+1)=y(t)1-αeβИκ[δ+(1-δ) y(t)∏C(x(t))y(t)1-αeβИκ[δ+(1-δ) y(t)]∏C(x(t))+(1-y(t))1-αeβИκ[δ+(1-δ) (1)-y(t))]πC(x(t)),(6)式中▽κ=1-(1)-α) (1)- κ) 。通过取极限α,我们可以得到等式(6)的连续时间版本→ 0和β→ 0,因此α/β的比率是有限的。更多详情见补充附录1。当δ=1且α=0时,β→ 0,EWA学习简化为复制器动力学的标准形式。当α>0(虽然很小)时,EWA减少为具有有限记忆的复制子动力学的一般形式(Sato and Crutch field,2003;Galla and Farmer,2013)。我们的第三个简化只有在玩家充分考虑放弃支付时才有效,即δ=1。在这种情况下,可以引入简化动力学的坐标变换,并有助于使EWA的研究在分析上易于处理。具体而言,我们引入了转换x=-ln公司x个- 1.,y=-ln公司y- 1.,(7) 仅对战略空间x,y内部的x,y有效∈ (0,1)。从数学上讲,这种坐标变换是一种差同态;这使得DynamicBloom油田的属性(1994)在实验装置中实现了这一想法。Cheung和Friedman(1997)还考虑了一个匹配协议和一个群体设置,在这个群体中,球员与其他群体中的所有球员匹配。这在激发混合策略方面也有类似的效果。雅可比或李雅普诺夫指数等系统不变(Ott,2002)。
|