楼主: 可人4
3303 142

[经济学] 策略转换和学习最优策略 [推广有奖]

141
能者818 在职认证  发表于 2022-4-26 15:10:19
这意味着MJ是一个VC子图类,例如,使用Van Der Vaart和Wellner(1996)中的定理2.6.7,我们可以推断:supQ∈Qnlog N(ε,Mj,| |·| | Q,2)=O(1)。因此,MJ很容易满足熵增长条件。考虑到(2.16)和(2.17)中力矩函数之间的关系,力矩条件(2.17)中力矩函数的分析几乎相同。现在,让jindex得到一个通用的矩函数:mj(Z,θ)=t(Z,x)-{Z=Z,X=X)},设Mj是相关的函数类:Mj={Mj(·θ):Z→ R:θ∈ Θ}.注:此类根据力矩条件(2.18)对力矩函数进行索引。还要注意的是,(z,x)不是矩函数的参数,而是与指数j有关。我们声称不存在被Mj破坏的大小为3的集合,这意味着Mj是一个VC子图类。要看到这一点,请注意,对于任意三个点{z,z,z},我们有:mj(z,θ)=t(z,x)-{z1,0=z,x=x)},mj(z,θ)=t(z,x)-{z2,0=z,x=x)},mj(z,θ)=t(z,x)-{z2,0=z,x=x)}。结论来自这样一个事实:这两个力矩函数必须总是相同的。这意味着MJ是一个VC子图类,使用范德法特和韦尔纳(1996)中的定理2.6.7,我们可以推断:supQ∈Qnlog N(ε,Mj,| |·| | Q,2)=O(1)。因此,MJ很容易满足熵增长条件。鉴于(2.18)和(2.19)中力矩函数之间的关系,力矩条件(2.19)中力矩函数的分析几乎相同。最后,让jindex得到一个通用的矩函数:mj(Z,Ud,θ)=Ud{Z=Z,X=X}Xz∈Zt(z,x)-{X=X}t(z,X)!。让Mj成为相关的函数类:Mj=mj(·,ud,θ):Z→ R:(ud,θ)∈ [Y,Y]×Θ.注:此类根据力矩条件(2.20)对力矩函数进行索引。

142
何人来此 在职认证  发表于 2022-4-26 15:10:25
还要注意的是,(z,x)不是矩函数的参数,而是与指数j有关。我们声称不存在被Mj破坏的大小为5的集合,这意味着Mj是一个VC子图类。要看到这一点,请注意,对于任意五个点{z,z,z,z},我们有:mj(z,ud,θ)=ud{z1,0=z,x=x}Xz∈Zt(z,x)-{x=x}t(z,x)!,mj(z,ud,θ)=ud{z2,0=z,x=x}Xz∈Zt(z,x)-{x=x}t(z,x)!,mj(z,ud,θ)=ud{z3,0=z,x=x}Xz∈Zt(z,x)-{x=x}t(z,x)!,mj(z,ud,θ)=ud{z4,0=z,x=x}Xz∈Zt(z,x)-{x=x}t(z,x)!,mj(z,ud,θ)=ud{z5,0=z,x=x}Xz∈Zt(z,x)-{x=x}t(z,x)!。结论来自这样一个事实:对于所有θ,其中两个矩函数必须始终相同。这意味着MJ是一个VC子图类,使用Van Der Vaartand Wellner(1996)中的定理2.6.7,我们可以推断:supQ∈Qnlog N(ε,Mj,| |·| | Q,2)=O(1)。因此,MJ很容易满足熵增长条件。鉴于(2.20)和(2.21)中力矩函数之间的关系,力矩条件(2.21)中力矩函数的分析几乎相同。把所有的东西结合起来,应用定理4.1(ii),我们就得到了这个问题的策略空间Γ是可以学习的。

143
lenore2005 发表于 2022-4-26 15:14:24
先看看啦

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 21:25