|
Avtomatika i Teleekhanika(2),42–53。Vapnik,V.N.,Chervonenkis,A.Y.,1974年。关于有序风险最小化方法,II。Avtomatika i Teleekhanika(9),29–39。瓦里安,H.R.,2014年。大数据:计量经济学的新把戏。《经济展望杂志》28(2),3–27。《统计年鉴》38894-942。Zhang,C-H.,Huang,J.,2008年。高维线性回归中套索选择的稀疏性和偏差。《统计年鉴》361567-1594。机器学习研究杂志10555–568。学习研究72541–2563。Zou,H.,2006年。自适应套索及其oracle属性。《美国统计协会杂志》101(476),1418–1429。附录1屋顶。定理1。btestargminbRns(b | Xs,Ys)btrainargminbRnt(b | Xt,Yt)1- η,b、 R(b | X,Y)6 Rnt(b | Xt,Yt)1.-√-1Rntb | Xt、YtXt、YtRb | X、Y的一般化误差b和 = (1/nt){h ln[(nt/h)]+h- ln(η)}。表示M=Rnt(btrain | Xt,Yt)(1-√)-1、如果我们设置η=1/ntfor, VC不等式形成了GE的概率界。If(新台币/小时)→ ∞, thenlimen公司→∞ = 黎明→∞nt/h(ln[(nt/h)]+1)+limfnt→∞ntln(nt)=0。因此,VC不等式等于limen→∞PM- Rnt(btrain | Xt,Yt)> 1/nt= 0,b由于存在极值估计,其损失是有限的。因此,测试集合中每个数据点的丢失丢失(yi,bm(xi,b))∈[0,Bi],i 6 ns,其中bi是loss(yi,bm(xi,b))的上确界。而且,由于极值估计在L∞正常,黎明→∞Psupb公司∈∧Rns(b | Xs,Ys)- R(b | X,Y)| 6= 1.>0|Rns(b | Xs,Ys)- R(b | X,Y)| Lossyi,bmxi,btrainproperty,对于1<p 6 2,τ,即SUPB∈∧pqR[损耗(yi,bm(xi,b))]pdF(x,y)RLoss(yi,bm(xi,b))dF(x,y)6τ。提供计算收敛速度或概率的下限。
|