|
已实施SRM,以减少分类中的过度匹配,计算VC维度。统计研究人员忽略了上限,因为经验GE和实际GE不同,特别是在有限样本中,VC维度仅适用于包括线性回归在内的3种模型。经验GE和实际GE之间的准确性、收敛速度和分歧符合以下定理,该定理说明了有限样本和渐近情况下经验GE最小值和结构风险最小值之间的关系。定理1。sup | Rnsb-Rb | P→经验GE持有的bEsseen界概率至少为$(1-/nt),$ ∈ (0,1)。Rns(b | Xs,Ys)6 M+,(5)其中Rns(b | Xs,Ys)是测试集上b的经验风险,M=Rnt(b | Xt,Yt)(1-√),=p√2·τ(E[损失(yi,bm(xi,btrain))]))p√1.- $ · n1型-1/ps,其中p是严格大于1的数字,τ已在引理2中定义。因此,我们立即得出以下推论。推论1。基于定理1,asen→ ∞经验GE极小化和结构风险极小化收敛到相同的极限。定理1和推论1为研究模型复杂性的控制奠定了基础,包括使用Lasso作为经验GE极小化,并且还证明,从无分布和无模型的角度来看,SRM渐近等价于经验GE极小化。通过使用(5)中的界限,可以量化SRM和经验GE最小化之间的差异,也可以得出SRM和经验双子化之间差异的置信界限。模型选择,尤其是套索。如附录2中的CV Lasso算法所示,Lasso为每个λ返回一个向量Bλ。λ的较大值映射到一个较小的ERVC维度horp,称为模型的“容许结构”(Vapnik和Chervonenkis,1971b)。
|