|
特别地,利用获得的F{i},F{i,j}和^a(θi),选择过程执行以下步骤:1。定义阈值参数 ∈ (0,1)。2。通过丢弃不会提高或降低性能的特性来进行预选。特别是,对于{i}重要性大于:U*= {i∈ Z | F{i}>}, (12a)或至少有一个成对贡献F{i,j}大于:U*= {i∈ Z | j∈ Z \\{i}:F{i,j}>}.(12b)3。U中的其余功能*∪ U*,执行第二次选择U*通过丢弃包含时预测边际性能^a(θi)低于排除时预测边际性能^a(θi)的特征,即:U*= {i∈ U*∪ U*| θi∈ Θi:uθi,0<^a(θi)},(12c),其中uθi,0表示排除特征i.4的边际性能^a(θi=0)。最后,可通过以下方式获得选定的二进制特征集:U*B=U*∩ B、 (12d)类似地,对于最优整数特征集*一、 选择是根据功能本身和最佳性能的实例化来完成的:U*我={i,θ*i} | i∈ U*∩ 一、 θ*i=argmaxθi^a(θi).(12e)6.2。案例研究为了评估所提出的算法,我们使用它来选择预测比利时价格的特征,并首次评估市场整合的影响,即法国特征对预测比利时价格的影响。为了进行分析,我们考虑了第5.6.2.1节中提出的第一个和更简单的DNN。特征定义为了执行特征选择,我们首先需要将每个可能的输入建模为二进制或整数特征。
|