|
如果我们用Kr表示强化回归中固定基础的基数,那么与标准回归相关的成本比由(19)/(23)给出,这是系数的成本标准回归系数的强化回归成本=Kr+J/2K1+Krc*/cf1+Kc*/另一方面,在标准情况下,基于新实现的后续较低估计值将需要大约NtestJ Kcf,产生成本比(见(22)),成本新模拟强化回归成本新模拟标准d回归=Kr+J/2K+J KrKc*/综上所述,我们得出结论,当(Kr+J/2)/K为“小”时,由于强化回归算法而导致的成本降低是“大”的,而在下限结构中,当除了J c*. cf(例如)。一些理论结果让我们考虑一个随机向量(X,Y)∈ 某些概率空间上的Rd×R(Ohm, F、 P),基于样本(x(n),Y(n)),n=1,…,估计条件经验u(x)=E[Y | x=x],(24)的问题,N、 根据(X,Y)的联合分布。假设回归基由一组固定的标准基函数ψk:Rd组成→ R、 k=1。。。,K、 (例如,多项式)和一组辅助基函数ν,νb,其中通常b要小得多,谢谢。其思想是,函数u可以很好地由mVb的函数来逼近:=span{ν,…,νb}。在这种情况下,可以考虑最小二乘问题,eβ:=ar g infβ∈RK+bNXn=1Y(n)-KXk=1eβkψk(X(n))-bXk=1eβK+KνK(X(n))!(25)s eteu(x)=KXk=1eβkψk(x)+bXk=1eβk+kνk(x)。(26)以下定理为eu提供了误差界限,请参见【10】。定理1。(精度标准全局回归)修正一些ε∈ (0 , 1). 假设是SUPX∈Rd | u(x)|≤ L和supx∈RdVar[Y | X=X]≤ σ、 那么它以至少1的概率成立- εZ | eu(x)- u(x)|u(dx)。
|