楼主: 可人4
3298 142

[经济学] 策略转换和学习最优策略 [推广有奖]

91
可人4 在职认证  发表于 2022-4-26 15:04:32
Van Der Vaart and Wellner(1996)引理2.3.1)我们有:supγ∈Γsupθ∈Θmaxλ∈ΛE(Pnh`b(·,θ,γ,λ)- phb(·,θ,γ,λ))≤ E supγ∈Γsupθ∈Θmaxλ∈ΛPnh`b(·,θ,γ,λ)- phb(·,θ,γ,λ)≤ 2E | | Rn | |(H`b),(b.18),其中最终的外部期望是一个联合期望,也接管了Rademacher随机变量。现在让λ*(θ, γ),^λ(θ, γ), θ*(γ),^θ(γ), γ*^γ如备注B.1所示,并设d(ψ)=^γ。

92
mingdashike22 在职认证  发表于 2022-4-26 15:04:40
那么我们有:EI`b[~n](d(ψ))=E infθ∈Θmaxλ∈λphb(·,θ,d(ψ),λ)(根据定理3.1),=E infθ∈ΘP h`b(·,θ,d(ψ),λ)*(θ,d(ψ)),(自λ)*对于任意(θ,γ)),=EP h`b(·θ),在P处是最优的*(d(ψ)),d(ψ),λ*(θ*, d(ψ)))-ε、 (自θ)*是ε-(P,λ)处的最优*) 对于任何γ),≥ EP h`b(·θ)*(d(ψ)),d(ψ),^λ(θ)*(d(ψ)),d(ψ)))-ε、 (自λ起)*对于任何(θ,γ)),在P处都是最佳的,≥ EPnh`b(·θ)*(d(ψ)),d(ψ),^λ(θ)*(d(ψ)),d(ψ)))-2E | | Rn | |(H`b)-ε、 (根据(B.18)),≥ EPnh`b(·,^θ(d(ψ)),d(ψ),^λ(^θ(d(ψ)),d(ψ)))-2E | | Rn | |(H`b)-2ε(因为对于任何γ,^θ在(Pn,^λ)处是ε-最优的),为了注意可测性问题,我们可以使用Kosorok(2008)中引理6.10中给出的马尔可夫不等式的外部测度版本。≥ EPnh`b(·,^θ(γ)*), γ*,^λ(^θ(γ*), γ*)) -2E | | Rn | |(H`b)-3ε(因为d(ψ)在(Pn,λ,θ)处是ε-最优的),≥ EPnh`b(·,^θ(γ)*), γ*, λ*(^θ(γ*), γ*)) -2E | | Rn | |(H`b)-3ε(因为对于任何(θ,γ),λ在Pn是最优的),≥ EP h`b(·,^θ(γ)*), γ*, λ*(^θ(γ*), γ*)) -4E | | Rn | |(H`b)-3ε(通过(B.18)),≥ EP h`b(·θ)*(γ*), γ*, λ*(θ*(γ*), γ*)) -4E | | Rn | |(H`b)-4ε(自θ起)*ε在(P,λ)处是最优的*) 对于任何γ),≥ E supγ∈ΓP h`b(·θ)*(γ), γ, λ*(θ*(γ), γ)) -4E | | Rn | |(H`b)-5ε(自γ)*ε在(P,λ)是最优的*, θ*)),≥ E supγ∈Γinfθ∈ΘP h`b(·,θ,γ,λ)*(θ, γ)) - 4E | | Rn | |(H`b)-5ε(自θ起)*ε在(P,λ)是最优的*) 对于任何γ),≥ E supγ∈Γinfθ∈Θmaxλ∈∧phb(·,θ,γ,λ)- 4E | | Rn | |(H`b)-5ε(自λ起)*对于任何(θ,γ)),在P处都是最佳的,≥ E supγ∈ΓI`b[Γ](γ)- 4E | | Rn | |(H`b)-5ε(根据定理3.1)。由于ε>0可以取任意小,我们得出结论:Esupγ∈ΓI[Γ](γ)- I[~n](d(ψ))≤ 4E | | Rn | | |(H`b)。

93
能者818 在职认证  发表于 2022-4-26 15:04:48
(B.19)因此,有必要限制Rademacher复杂性,由E | | Rn | |(H`B)=E给出supγ∈Γsupθ∈Θmaxλ∈ΛnnXi=1ξi英菲∈G-(yi,zi,θ)infy?我∈G(yi,zi,ui,θ,γ)~n(vi)+u*JXj=1λjmj(yi,zi,ui,θ)!.如果H`bis在对称条件下不闭合,则将其重新定义为H`b∪ (-H`b);出于我们的目的,这不会失去一般性,因为这个操作只能增加E | | Rn | | |(H`b)的值。然后我们有来自莱玛的消息。7对于任何ε>0:E | | Rn | | |(H`b)≤2ε√n+2Diamψ,2(H`b)rlog n(ε,H`b,| |·| |ψ,2)n.(b.20)由于函数类H`bis一致有界,我们有直径ψ,2(H`b)<∞. 它仍然受制于计量熵。为此,我们将定义:HI:=(h(·u,θ,γ,λ):Y×Z→ R:h(y,z,u,θ,γ)=infy?∈G(y,z,u,θ,γ)ν(v)+u*JXj=1λjmj(y,z,u,θ),(u,θ,γ,λ)∈ U×Θ×Γ×∧,(B.21)HII:=h(·,u,θ,γ):Y×Z→ R:h(y,z,u,θ,γ)=infy?∈G(y,z,u,θ,γ)ν(v),(u,θ,γ)∈ U×Θ×Γ, (B.22)HIII:={h(·u,y?):Y×Z→ R:h(y,z,u,y?=~n(y,z,u,y?),(u,y?)∈ U×Y?},(B.23)艾滋病毒:=h(·,u,θ,λ):Y×Z→ R:h(y,z,u,θ)=JXj=1λjmj(y,z,u,θ),(u,θ,λ)∈ U×Θ×∧. (B.24)通过引理B.6,我们得到:N(ε,H`B,| |·| |ψ,2)≤ N(ε/2,HI,| |·| |ψ,2)。根据引理B.8,我们还有:N(ε/2,HI,| |·| |ψ,2)≤ N(ε/2,HII,|·| |ψ,2)N(ε/2,HIV,|·|ψ,2)。再次应用引理B.6,我们得到:N(ε/2,HII,| |·| |ψ,2)≤ N(ε/4,HIII,| |·| |ψ,2)。最后,从引理B.8的迭代应用:N(ε/2,HIV,| |·| |ψ,2)≤JYj=1N(ε/(2J),Mj,| | | | | |ψ,2),我们得出结论:对数N(ε,H`b,| | | |ψ,2)≤ logn(ε/4,HIII,| |·| |ψ,2)+JXj=1logn(ε/(2J),Mj,|·| |ψ,2)≤ supQ∈Qnlog N(ε/4,HIII,| |·| | Q,2)+JXj=1supQ∈Qnlog N(ε/(2J),Mj,| |·| | Q,2),具有概率为1/N整数倍的原子的所有离散概率测度Qnon X的上确界。

94
能者818 在职认证  发表于 2022-4-26 15:04:55
由于假设HIII和MJ满足熵增长条件,因此前一个显示的右侧为o(n)级。结合(B.20),我们可以看到,对于任何(c,κ)对,都存在一些n,使得4E | | Rn | |(H`B)≤ c(1)- κ). 将此与(B.19)和(B.17)相结合,屋顶就完成了。定理5.1的证明。回想一下:h`b(y,z,θ,γ,λ):=infu∈G-(y,z,θ)infy?∈G(y,z,u,θ,γ)ν(v)+u*JXj=1λjmj(y,z,u,θ)!。为便于注释,我们将定义为:Pnh`b(·θ,γ,λ):=nnXi=1infui∈G-(yi,zi,θ)infy?我∈G(yi,zi,ui,θ,γ)~n(vi)+u*JXj=1λjmj(yi,zi,ui,θ)!,phb(·,θ,γ,λ):=Zinfu∈G-(y,z,θ)infy?∈G(y,z,u,θ,γ)ν(v)+u*JXj=1λjmj(y,z,u,θ)!dPY,Z.我们认为有必要设置cn(κ)=2cn(ψ,κ)+5ε,其中cn(ψ,κ)满足:supγ∈Γsupθ∈Θmaxλ∈ΛPnh`b(·,θ,γ,λ)- phb(·,θ,γ,λ)≤ ~cn(ψ,κ),(B.25),概率至少为κ/2。让λ*(θ, γ),^λ(θ, γ), θ*(γ),^θ(γ), γ*和^γ应如注释B.1和setd(ψ)=^γ所示。

95
大多数88 在职认证  发表于 2022-4-26 15:05:01
那么我们有:I`b[~n](d(ψ))=infθ∈Θmaxλ∈λphb(·,θ,d(ψ),λ)(根据定理3.1),=infθ∈ΘP h`b(·,θ,d(ψ),λ)*(θ,d(ψ)),(自λ)*对于任何(θ,γ)),在P处是最优的,=phb(·θ)*(d(ψ)),d(ψ),λ*(θ*, d(ψ)))-ε、 (自θ)*是ε-(P,λ)处的最优*) 对于任何γ),≥ phb(·,θ)*(d(ψ)),d(ψ),^λ(θ)*(d(ψ)),d(ψ)))-ε、 (自λ起)*对于任何(θ,γ)),在P处都是最佳的,≥(κ/2)Pnh`b(·θ)*(d(ψ)),d(ψ),^λ(θ)*(d(ψ)),d(ψ)))- ~cn(ψ,κ)-ε、 (由(B.25)修订),≥ Pnh`b(·,^θ(d(ψ)),d(ψ),^λ(^θ(d(ψ)),d(ψ)))- ~cn(ψ,κ)-2ε(因为对于任何γ,θ在(Pn,λ)处是ε-最优的),≥ Pnh`b(·,^θ(γ)*), γ*,^λ(^θ(γ*), γ*)) - ~cn(ψ,κ)-3ε(因为d(ψ)在(Pn,λ,θ)处是ε-最优的),≥ Pnh`b(·,^θ(γ)*), γ*, λ*(^θ(γ*), γ*)) - ~cn(ψ,κ)-3ε(因为对于任何(θ,γ),λ在Pn是最优的),≥(κ/2)phb(·,^θ(γ)*), γ*, λ*(^θ(γ*), γ*)) -2~cn(ψ,κ)-3ε(通过(B.25)),≥ phb(·,θ)*(γ*), γ*, λ*(θ*(γ*), γ*)) -2~cn(ψ,κ)-4ε(自θ起)*ε在(P,λ)处是最优的*) 对于任何γ),≥ supγ∈ΓP h`b(·θ)*(γ), γ, λ*(θ*(γ), γ)) -2~cn(ψ,κ)-5ε(自γ)*ε在(P,λ)是最优的*, θ*)),≥ supγ∈Γinfθ∈ΘP h`b(·,θ,γ,λ)*(θ, γ)) - 2~cn(ψ,κ)-5ε(自θ起)*ε在(P,λ)是最优的*) 对于任何γ),≥ supγ∈Γinfθ∈Θmaxλ∈∧phb(·,θ,γ,λ)- 2~cn(ψ,κ)-5ε(自λ起)*对于任何(θ,γ)),在P处都是最佳的,≥ supγ∈ΓI`b[Γ](γ)- 2~cn(ψ,κ)-5ε(根据定理3.1)。“每个不平等”≥(κ/2)“概率至少为κ/2。注意,这显示:supγ∈ΓI`b[Γ](γ)- I`b[^](^γ)≤ 2~cn(ψ,κ)+5ε,概率至少为κ。为了满足(B.25),显然需要选择cn(ψ,κ)来满足:supPY,Z∈PY,ZP纽约,Zsupγ∈Γsupθ∈Θmaxλ∈ΛPnh`b(·,θ,γ,λ)- phb(·,θ,γ,λ)≥ ~cn(ψ,κ)≤ 1.- κ/2.

96
大多数88 在职认证  发表于 2022-4-26 15:05:07
(B.26)根据Koltchinskii(2011)定理4.6,我们得到了任意t>0:supPY,Z∈PY,ZP纽约,Zsupγ∈Γsupθ∈Θmaxλ∈ΛPnh`b(·,θ,γ,λ)- phb(·,θ,γ,λ)≥ 2 | | Rn | |(H\'b)+3次√N≤ 经验-T.现在设置:~cn(ψ,κ)=2 | | Rn | | |(H`b)+s18 ln(2/(2- κ) )嗯。然后我们有:cn(κ)=4 | | Rn | | |(H`b)+s72 ln(2/(2)- κ) )Hn+5ε。然后我们得出结论(5.4)。定理5.2的证明。让T,T[和T]如引理5.1所定义。在这个证明中,注意以下事实是有用的:(i)函数δ7→ Tn(δ),T(δ)是非递减的左连续阶跃函数,在区间[0,δ]上大于或等于零,否则为零。(ii)功能σ7→ T[n(σ),T[(σ)是非递增的且左连续的,其唯一可能的不连续点位于{δj}∞j=0。(iii)功能η7→ T] n(η),T(η)是不增加的,连续的。现在对于任何η>0的情况,让我们:δ*= T] n(1)-1/a)+η,δ**= T] (1)-1/a)+η,其中η=η+ε,对于某些ε>0。注意,选择δ**略大于T](1)- 1/a)确保T[(δ**) ≤ 1.- 1/a.类似注释适用于δ*和T]n(1)-1/a)。根据引理5.1的证明,我们知道存在一个与ENP有关的事件纽约,Z(英语)≥ κ使得在Enweg上*(δ)  每δ的Gn(bδ)≥ δ**. 因此,对于每个δ≥ δ**我们有一个关于T(δ)≤ Tn(δ),其中T(δ)δ≤Tn(δ)δ,对于所有δ≥ δ**. 因此,在Enwe上有T[(σ)≤ T[n(σ)对于任何σ≥ δ**, 尤其是:T[(δ**) := supδ≥δ**T(δ)δ≤ supδ≥δ**Tn(δ)δ=:T[n(δ**), (B.27)回想一下我们对δ的选择**确保T[(δ**) ≤ 1.-1/a.我们现在可以区分事件中的两种情况:1。我们有:supδ≥δ**T(δ)δ≤ 1.-A.≤ supδ≥δ**Tn(δ)δ。在这种情况下,我们有T[n(δ**) ≥ 1.-1/a,因此T]n(1-1/a)≥ δ**, 所以δ*> δ**(参见δ的定义)*和δ**上图)。我们有:supδ≥δ**T(δ)δ≤ supδ≥δ**Tn(δ)δ<1-a、 这意味着(i)T](1- 1/a)≤ T] n(1)- 1/a)<δ**, 或(ii)T]n(1)- 1/a)<T](1)- 1/a)<δ**. 在案例(i)中,我们显然有*≥ δ**.

97
何人来此 在职认证  发表于 2022-4-26 15:05:13
在情况(ii)中,设:c:=T](1)-1/a)- T] n(1)-1/a)>0。然后:δ**- δ*= T] (1)-1/a)+η- T] n(1)-1/a)- η=c-ε、 其中最后一行来自η的定义。现在假设我们的ε>0的c>ε在证明的开始处被选中。我们将证明这会产生矛盾。为了理解这种方法,请注意,c的值并不取决于η>0的值,因此c>ε的假设对于每个η>0都必须成立。如果我们能证明,对于某些η>0,c<ε,我们将得到我们想要的矛盾。回想一下,在Enwe上有T[(σ)≤ T[n(σ)对于任何σ≥ δ**. 这意味着,对于任何r>0,ifT](r)≥ δ**然后T]n(r)≥ T] (r)。现在选择一个值rη∈ R最接近1- 1/a使rη≤ 1.- 1/a和:T](rη)=T](1-1/a)+η=δ**.这样的选择总是可能的,因为T]是连续的,并且T]是非递增的。取η(也就是δ**) 只要足够小,我们就可以通过T]的连续性得出结论,点rη也可以任意选择接近1-1/a.通过T]n的连续性回忆存在ε>0,例如T]n(x)- T] n(1)- 1/a)<ε- 1/a)<x+ε。现在选择rη≤ 1.- 1/a如此-1/a<rη+ε,我们有:c=T](1)-1/a)- T] n(1)-1/a)<T](rη)-T] n(1)-1/a)≤ T] n(rη)-T] n(1)-1/a)<ε。这当然与每一个η>0的选择都是c>ε这一事实相矛盾。我们得出结论,c≤ ε、 自δ**- δ*= C-ε、 我们有δ**≤ δ*.我们得出结论,在所有情况下**≤ δ*安恩。结果直接来自引理5.1。引理5.1的证明。

98
何人来此 在职认证  发表于 2022-4-26 15:05:21
回想一下:h`b(y,z,θ,γ,λ):=infu∈G-(y,z,θ)infy?∈G(y,z,u,θ,γ)ν(v)+u*JXj=1λjmj(y,z,u,θ)!。为便于注释,我们将定义为:Pnh`b(·θ,γ,λ):=nnXi=1infui∈G-(yi,zi,θ)infy?我∈G(yi,zi,ui,θ,γ)~n(vi)+u*JXj=1λjmj(yi,zi,ui,θ)!,phb(·,θ,γ,λ):=Zinfu∈G-(y,z,θ)infy?∈G(y,z,u,θ,γ)ν(v)+u*JXj=1λjmj(y,z,u,θ)!dPY,Z.定义事件:En,j:=(supθ,θ∈Θsupγ,γ∈G*(δj)supλ,λ∈∧|(Pnh`b(·,θ,γ,λ)- Pnh`b(·,θ,γ,λ))-(Ph`b(·,θ,γ,λ)- phb(·,θ,γ,λ))|≤ T(δj)),和:En:={j:δj≥δ**}En,j.(B.28)注意,当δ>0时,值2H是H`B(δ)中任何函数的上界。通过选择δ>2H,我们得到了:supPY,Z∈PY,ZP纽约,ZEcn,0= 此外,根据霍夫丁不等式的统一版本(例如Koltchinskii(2011)定理4.6,第71页),我们有:supPY,Z∈PY,ZP纽约,ZEcn,j≤ 经验-tj!,每j∈ N.我们通过联合定界得出结论:infPY,Z∈PY,ZP纽约,Z(英语)≥ 1.-X{j:δj≥δ**}经验-tj!。现在请注意,对于c=5,c=(3/(2κ))2/5和tj=pclog(c·j),我们有:X{j:δj≥δ**}经验-tj!≤∞Xj=1exp-tj=∞Xj=1exp-阻塞(c·j)=∞Xj=1(c·j)-c=2(1)-κ)∞Xj=1J5/2≤2(1 -κ)= 1.-κ.因此我们得出结论:infPY,Z∈PY,ZP纽约,Z(英语)≥ κ. (B.29)剩余的证据分为两部分:1。我们将在活动中展示我们对任何γ的反应∈ Γ,En(γ)≤ (2 - 1/a)(E)*(γ) ∨ δ**). 然后,我们将利用这个事实来论证,在En上,对于任何δ≥ δ**我们有G*(δ)  Gn((2)-1/a)δ)。我们将在活动中展示我们对任何γ的反应∈ Γ,E*(γ) ≤ a(En(γ)∨ δ**). 然后我们将利用这一事实来论证,在En上,对于任何δ≥ aδ**我们有Gn(δ/a) G*(δ).在整个证明过程中,让λ*(θ, γ),^λ(θ, γ), θ*(γ),^θ(γ), γ*^γ应如备注B.1所示。第1部分:我们将证明在事件中我们有En(γ)≤ (2 - 1/a)(E)*(γ) ∨ δ**) 对于任何γ∈ Γ.首先,考虑σ=E的任意γ*(γ) ≥ δ**. 选择任意ε>0,使δ**≥ ε、 这是可能的,因为δ**> T] (1)-1/a)≥ 0

99
可人4 在职认证  发表于 2022-4-26 15:05:28
那么在这个事件上,我们有:En(γ):=supγ∈Γinfθ∈Θmaxλ∈λPnh`b(·,θ,γ,λ)- infθ∈Θmaxλ∈λPnh`b(·,θ,γ,λ)≤ infθ∈Θmaxλ∈∧Pnh`b(·,θ,γ,λ)- infθ∈Θmaxλ∈∧Pnh`b(·,θ,γ,λ)+3ε=infθ∈Θmaxλ∈∧phb(·,θ,^γ,λ)- infθ∈Θmaxλ∈∧phb(·,θ,γ,λ)+infθ∈Θmaxλ∈∧phb(·,θ,γ,λ)- infθ∈Θmaxλ∈∧phb(·,θ,^γ,λ)-infθ∈Θmaxλ∈λPnh`b(·,θ,γ,λ)- infθ∈Θmaxλ∈λPnh`b(·,θ,^γ,λ)+ 3ε≤ supγ∈Γinfθ∈Θmaxλ∈∧phb(·,θ,γ,λ)- infθ∈Θmaxλ∈∧phb(·,θ,γ,λ)+infθ∈Θmaxλ∈∧phb(·,θ,γ,λ)- infθ∈Θmaxλ∈∧phb(·,θ,^γ,λ)-infθ∈Θmaxλ∈λPnh`b(·,θ,γ,λ)- infθ∈Θmaxλ∈λPnh`b(·,θ,^γ,λ)+ 3ε=E*(γ) +infθ∈Θmaxλ∈∧phb(·,θ,γ,λ)- infθ∈Θmaxλ∈∧phb(·,θ,^γ,λ)-infθ∈Θmaxλ∈λPnh`b(·,θ,γ,λ)- infθ∈Θmaxλ∈λPnh`b(·,θ,^γ,λ)+ 3ε.现在注意:infθ∈Θmaxλ∈∧phb(·,θ,γ,λ)- infθ∈Θmaxλ∈∧phb(·,θ,^γ,λ)≤ infθ∈Θmaxλ∈∧phb(·,θ,γ,λ)- 最大λ∈∧phb(·,θ)*(^γ), ^γ, λ) + ε≤ 最大λ∈λphb(·,^θ(γ),γ,λ)- 最大λ∈∧phb(·,θ)*(^γ), ^γ, λ) + 2ε≤ 最大λ∈λphb(·,^θ(γ),γ,λ)- phb(·,θ)*(^γ), ^γ,^λ(θ*^γ,^γ)+2ε=phb(·,^θ(γ),γ,λ*(^θ(γ), γ)) - phb(·,θ)*(^γ), ^γ,^λ(θ*(^γ), ^γ)) + 2ε.类似地:infθ∈Θmaxλ∈λPnh`b(·,θ,^γ,λ)- infθ∈Θmaxλ∈λPnh`b(·,θ,γ,λ)≤ infθ∈Θmaxλ∈λPnh`b(·,θ,^γ,λ)- 最大λ∈λPnh`b(·,^θ(γ),γ,λ)+ε≤ 最大λ∈∧Pnh`b(·θ)*(^γ), ^γ, λ) - 最大λ∈λPnh`b(·,^θ(γ),γ,λ)+2ε≤ 最大λ∈∧Pnh`b(·θ)*(^γ), ^γ, λ) - Pnh`b(·,^θ(γ),γ,λ)*(θ(γ,γ))+2ε=Pnh`b(·θ)*(^γ), ^γ,^λ(θ*(^γ), ^γ)) - Pnh`b(·,^θ(γ),γ,λ)*(^θ(γ), γ)) + 2ε.因此我们得出结论:En(γ)≤ E*(γ) +7ε+phb(·,^θ(γ),γ,λ)*(^θ(γ), γ)) - phb(·,θ)*(^γ), ^γ,^λ(θ*(^γ), ^γ))-Pnh`b(·,^θ(γ),γ,λ)*(^θ(γ), γ)) - Pnh`b(·θ)*(^γ), ^γ,^λ(θ*(^γ), ^γ)).然而,γ∈ G*(σ) 根据假设和引理B.9,我们得到了^γ∈ G*(σ) 关于这个事件。

100
能者818 在职认证  发表于 2022-4-26 15:05:36
因此,前一个显示的右侧可以限定在上面:ph`b(·,^θ(γ),γ,λ*(^θ(γ), γ)) - phb(·,θ)*(^γ), ^γ,^λ(θ*(^γ), ^γ)) -Pnh`b(·,^θ(γ),γ,λ)*(^θ(γ), γ)) - Pnh`b(·θ)*(^γ)≤ supθ,θ∈Θsupγ,γ∈G*(σ) supλ,λ∈∧|(Pnh`b(·,θ,γ,λ)- Pnh`b(·,θ,γ,λ))-(Pnh`b(·,θ,γ,λ)- Pnh`b(·,θ,γ,λ))|。此外,对于任何σ≥ δ**, 在该事件中,最终数量以T(σ)为界;这源于T(σ)的定义和映射的单调性:x7→ supθ,θ∈Θsupγ,γ∈G*(x) 最大λ,λ∈∧|(Pnh`b(·,θ,γ,λ)- Pnh`b(·,θ,γ,λ))-(Ph`b(·,θ,γ,λ)- phb(·,θ,γ,λ))|。因此关于En:En(γ)≤ E*(γ) +T(σ)+7ε=E*(γ) +T(σ)σ+7ε≤ E*(γ) +supδ≥σT(δ)δσ+7ε=E*(γ) +T[(σ)σ+7ε=E*(γ) +T[(σ)E*(γ) + 7ε.既然≥ δ**> T] (1)- 1/a)我们有T[(σ)≤ T[(δ**) ≤ 1.- 1/a.因此,在事件En中,如果γ是*(γ) ≥ δ**, 我们有:En(γ)≤2.-A.E*(γ) + 7ε.因为ε>0是任何值,使得δ**≥ ε、 因此可以任意变小,我们得出结论,在这个事件中,我们对任何带E的γ都有*(γ) ≥ δ**:En(γ)≤2.-A.E*(γ).现在考虑σ:=E的情况*(γ) ≤ δ**.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 21:22