|
(40)可以将所有内容除以β并重新缩放时间,以便β给出一个时间单位。然后在极限β内→ 0上述方程式的左侧为IMβ→0ln xt+β- ln xtβ=˙xx(41)当κ=0的情况被排除在经验的稳态条件之外时,κ只是乘以β的常数。x的学习动态可以连续写为˙xx=[δ+(1- δ) x]∏R(y)-x[δ+(1- δ) x]∏R(y)-(1)- x) [δ+(1- δ) (1)-x) ]πR(y)-αβ(ln x- x ln x- (1)- x) ln(1- x) )。(42)这通常是方程(6)中EWA动力学的连续时间近似值。在δ=1的情况下,替换∏Rand∏R的表达式,我们得到˙xx=ay+b(1-y)-(轴+bx(1-y) +c(1-x) y+d(1-x) (1)-y) ()-αβ(ln x- H(x)),(43),其中H(x)=x ln x+(1-x) ln(1-x) 是混合策略的信息熵(x,1-x) 。这是Sato and Crutch fi field(2003)中分析的动力学。如果α=0,即在不确定性条件下,上述方程将简化为两种群复制动力学的标准形式(Hoffauer和Sigmund,1998)。分析循环对策中等式(43)的稳定性是有用的。我们根据A、B、C和D重写了replicatordynamics(43),因子A 1- x项并写出相应的y方程:˙x=x(1-x)4Ay+2(B-A) +αβ(ln(1- x)-ln x),˙y=y(1- y)4Cx+2(D- C) +αβ(ln(1- y)-ln y).(44)根据第7.1节的分析,我们将重点放在B=D=0和c=-A、 即匹配的便士。在这种情况下,复制器动态的固定点是(0,0),(0,1),(1,0),(1,1)和(1/2,1/2)。对于α的任何值,固定点(0,0)、(0,1)、(1,0)和(1,1)总是不稳定的。固定点(1/2,1/2)的特征值为λ±=-αβ±iA。
|