|
(平均实例),该属性使用树进行高度分类,27个实例中有22个是Na"ive Bayes,27个实例中有15个是supportvector machine的最低分类。(很好的例子),使用AdaBoost对属性进行了高度分类,30个实例中有27个,最低分类来自KNearest邻居(KNN),30个实例中有11个。(Goodinstance),使用支持向量机(SVM)和AdaBoost对该属性进行高度分类,64个实例中有56个实例,最低分类来自K最近邻(KNN),46个实例中有43个实例。图2.30 Hamza Saad:数据挖掘在生产过程中的应用图2给出了混淆矩阵。七种算法的混淆矩阵。3.3. 接收器工作特性接收器工作特性从0缩放到1,0表示预测不良,1表示预测较高。Sevencolors Azura、勃艮第、祖母绿、铜、梨、蓝紫色和淡蓝色分别与树木、神经网络、随机森林、KNN、AdaBoost、SVM和天真贝叶斯区分开来。在X轴上有FP率(1特异性),在Y轴上有TP率(敏感性)。图3显示了数据集中使用每个appliedalgorithm输出的三个实例的接收器工作特性(ROC)。工业工程2018;2(1):26-33 3132 Hamza Saad:数据挖掘在生产过程中的应用图3。每个属性的接收器操作特征(ROC曲线)随机森林算法给出的曲线下的最高面积达到(0.932),然后朴素贝叶斯得到曲线下的(0.908)面积。KNN(K近邻)记录了所有算法中曲线下的最小面积,达到(0.668)。
|