|
K-折叠交叉验证案例。π(1-1/nt)KK∑q=1bqFSR-b*qKK公司∑q=1ntρ*re公司eqt1.-√ε-KK公司∑q=1nsρ*雷克斯克+KK公司∑q=1nsρ*re公司(eqs)TXqs∞kbFSRk+ρ*re(16),其中ρ*reis definedminq{ρqre |ρqreis的最小限制特征值Xqs公司TXqs,给定q}和bqFSRis,在第qt轮交叉验证中,FSR估计量。图形8.日志日志日志日志日志日志***图8:bFSRand b的收敛性*随着n的增加,共3LL。b*如果limn为真DGP→∞对数(p)/en=0。D F和B之间的差异*作为FSR估计器GA和PopulationCorolution 3以类似方式的函数。4.模拟样本内和样本外的拟合优度,我们提出了以下广义的测量方法:GR=1.-Rns(btrain | Ys,Xs)TSS(Ys)×1.-Rnt(btrain | Yt,Xt)TSS(Yt)= Rs×Rt(17)RsRRtGRbtrainRns(btrain | Ys,Xs)Rnt(btrain | Yt,Xt)收敛到相同的概率极限asen→ ∞.表1:GRRshigh lowhigh high GR(理想模型)相对较低GR(过拟合)Rtlow相对较低GR(罕见)极低GR(欠拟合)的四种风格化场景表1总结了GR的四种基本场景。一个既能很好地拟合训练集又能很好地拟合测试集的模型将具有较高的R和S值,因此具有较高的GR。当过度拟合发生时,温度会相对较高,温度会较低,从而降低GR。当不匹配发生时,训练集上的TRSgrestimated更适合测试集(RSI高而Rtlow)。Lγ图4和图7,当惩罚指标γ的范数>1时,惩罚回归在模型选择上的效率较低。因此,我们关注L-惩罚或套索型回归。对于模拟,我们假设结果y由以下DGP生成:y=Xβ+u=Xβ+Xβ+uX=(X,···,xp)∈ Rpvar(xi)=1 corr(xi,xj)=0.9,i、 jβ=(2,4,6,8,10,12)Tβ(p-6) 向量。由均值和方差σ为零的正态分布生成的UI。
|