|
14].定义(部分依赖)。假设特征X=X,X,···,Xp,索引为p={1,2,···,p}。LetSand及其互补的RBE子集,即S,R P∧ s∪ R=P∧ s∩ R=. 假设f(X)=f(XS,XR),f(X)对特征XSis,P DS(XS)=EXRf(XS,XR)的部分依赖性≈NNXi=1f(XS,xiR)(7)这是一个边际平均值,用于描述一组选定特征的影响。它近似为在互补集合XR中发生的每个实例(xiR)的预测在训练集中(X)的多个实例上的平均值。预印本——2014年12月8日(6,8)5(3,2)3(3,0)2(0,2)5(2,3)4(1,3)2(1,1)2(0,2)6×-5 + 8 × -7 = -86-8-6-2-8-4-2 -214 × -86-(5×)-8 + 5 × -8 + 4 × -4)= -1108-18x xx-8x x实例数:wj(wY-esj,wNoj)节点的贡献:cj=Pi∈{Yes,No}wijNodes的重要性:nj=wjcj-主键∈{j}WKCK的子图A.6:计算图A中DT中特征重要性所需的五个元素。(7)的计算需要传递每一组X的联合值的数据。这可能是计算性的,因此,部分依赖关系通常不会使用三个以上的特征进行计算。幸运的是,pds(XS=yes)pds(XS=no)。实例海外网络)。根据用于计算部分相关性的不同值,我们可以绘制一张图表,其中包含x轴上的测试值和y轴上的部分相关性输出。绘图的作用是显示每个特征值驱动结果的方向(朝向标签“是”或“否”)。
|