|
因为y是以概率s作为伯努利随机变量采样的*(x) ,E[y | x]=s*(x) 。ES,x,y[(^s(x)- y) ]=ES,x,y((^s(x)- s*(x) +秒*(十)- y) )(52)=ES,x,y[((^s(x))- s*(x) )+2(^s(x)- s*(x) )(s*(十)- y) +(s*(十)- y) )](53)=ES,x,y[(^s(x)- s*(x) )]+Ex,y[(s*(十)- y) )]+2ES,x,y[(^s(x)- s*(x) )(s*(十)- y) ](54)=ES,x,y[(^s(x)- s*(x) )]+Ex,y[(s*(十)- y) )]+2倍ES,y[(^s(x)- s*(x) )(s*(十)- y) | x](55)=ES,x,y[(^s(x)- s*(x) )]+Ex,y[(s*(十)- y) )]+2倍ES[(^s(x)- s*(x) )| x]Ey[(s*(十)- y) | x](56)=ES,x,y[(^s(x)- s*(x) )]+Ex,y[(s*(十)- y) )](57)第四等式使用迭代期望定律;第五个使用条件独立性⊥ y | x;激光一次使用E[y | x]=s*(x) 。通过非常相似的过程,我们可以显示x,y[(y- s*F(x))]=Ex,y[(y- s*(x) +秒*(十)- s*F(x))](58)=Ex,y[(y- s*(x) )]+Ex,y[(s*(十)- s*F(x))]+2Ex,y[(y- s*(x) )(s*(十)- s*F(x))](59)=Ex,y[(y- s*(x) )]+Ex,y[(s*(十)- s*F(x))]+2倍(s)*(十)- s*F(x))Ey[y- s*(x) | x](60)=Ex,y[(y- s*(x) )]+Ex,y[(s*(十)- s*F(x))](61)组合上述两个方程式impliesEx,y[(s*(十)- y) )]=ES,x,y[(^s(x)- y) ]- ES,x,y[(^s(x)- s*(x) )](62)=Ex,y[(y- s*F(x))]- Ex,y[(s*(十)- s*F(x))](63)通过更改符号,它意味着[Lmse(^s)- Lmse(s)*F) )]=ES[Le(^s)- Le(s)*F) (64)命题4的证明。引理4.1表明,函数估计的估计误差与均方误差的估计误差相同。因此,我们将使用命题2提供MSE的上界。形式上,ES[Lmse(^s)- Lmse(s)*F) )]≤ 2ES[^Rn(lo F(S)](65)≤ 4ES[^Rn(F | S)](66)第一个不等式使用命题2;第二种方法使用收缩不等式,这里的平方损失在[0,1]之间有界,并且它的Lipschitz常数最多为2。附录二。D: 命题5的证明证明是一个逐层迭代的过程。
|