|
再次考察投资者财富过程的动力学Vπ在这个模型中,对于任何马尔科夫策略πt,我们可以用Vπt=Vexp的形式表示tXn=1f(Φn)= VexptPtn=1f(Φn)t, 总之≥ 1,(20)其中函数f由f(x,y)定义:=log(1 - π(x))+π(x)exp(y)- 十), x、 y∈ R、 (21)和Φt=(Xt-1,Xt),t∈ N、 是马尔可夫链。我们需要确保,对于任何马尔可夫策略πt,随机变量序列log(Vπt/V)=Ptn=1f(Φn)满足大偏差原理(LDP)假设。也就是说,我们需要极限∧f(θ):=limt→∞对于每个θ,存在tlog E(EθPtn=1f(Φn))∈ R、 满足[2]中定理2.3.6所述的G¨artner-Ellis定理的剩余条件。定义函数W:R→ [1, ∞) 由W(x,y):=1+|x |+|y |,对于所有x,y∈ R.显然,d=2和W=W的Wsaties(12)。引理3.11。f属于空间LW∞.证据为了所有的x,y∈ R、 自π(x)∈ [0,1],我们有1个-π(x)+π(x)exp(y)-十)≤ 1+exp(y)-x) 。因此f(x,y)≤ |x |+| y |+1。另一方面,对于0≤ A.≤ 1/2,我们有1个- a+a经验(y)- 十)≥ 1/2. 对于大于1/2的,我们有1-a+a经验(y)-十)≥ (1/2)经验(y)-x) 。总之,我们得到了f(x,y)≥ 日志(1/2)-|x|-|y |代表所有x,y∈ R.因此| f(x,y)|≤ c(1+| x |+| y |),对于某些常数c>0,其结论如下。提案3.12。设πt为财富模型(3)中的任何马尔可夫策略。那么∧f(θ):=limt→∞t日志E(X-1,X)eθPtn=1f(Φn), θ ∈ R是一个定义良好的解析函数,因此平均stlog(Vπt/V)=tPtn=1f(Φn)满足具有良好速率函数∧的大偏差估计*f(λf的凸共轭)。证据根据定理3.5,∧f验证了[2]中G¨artner-Ellis定理2.3.6的条件(分析性意味着本质光滑性)。应用这个定理,我们得出结论。引理3.13。
|