|
回想一下,时间平均后悔是(13)TRT=TTXn=1αNxn+βN(1- xn)- 最小值(TTXn=1αNxn,TTXn=1βN(1- xn))考虑(14)TTXn=1αxn-TXn=1β(1- xn)=TTXn=1[(α+β)xn- β] =(α+β)TTXn=1xn-βα + β!.第6节讨论了这一定义背后的直觉以及动力系统混沌行为的其他性质。事实上,我们可以加强这一结果,见第6节。路由博弈中的混沌路径13数量βα+β是系统平衡b。在不丧失一般性的情况下,我们假设前面提到的α+β=1。那么,b=β和limT→∞TPTn=1xn= b、 根据定理3.3。因此,在极限T→ ∞, (13)最小项中的两项重合,我们通过替换α=1得到- β,记住β=blimT→∞RTT=极限→∞NTTXn=1(1 - β) xn+β(1- xn)- β(1 - β)= 限制→∞NTTXn=1xn公司- 2βxn+β= 限制→∞NTTXn=1(xn- b) 。观察,如果x是遍历不变概率测度u的一般点,则可观测的时间限制(x-b) 等于其空间平均值(x-b) du(x)。该数量是随机变量恒等式(我们将表示该变量X,soX(X)=X)相对于u的方差。一般点集具有正Lebesgue测度的此类测度u的典型情况是,存在吸引周期轨道,并且u是在P上等分布的测度,并且u是相对于Lebesgue测度绝对连续的遍历不变概率测度[28]。类似于二次区间映射族[51],我们有理由认为对于Lebesgue几乎每对参数(a,b)Lebesgue几乎每一个点x∈ (0,1)是这两种类型之一的度量的泛型。时间平均后悔上限:设a>4,b∈ (0, 1). 回顾(10)thatfa,bhas两个关键点xl=1.-第一季度-一和xr=1- xl码=1+q1-一.Letymin=fa,b(xr),ymax=fa,b(xl)。引理4.2。
|