AUC based pruning
这个没有语境,不好理解。AUC based pruning可能是指决策树的减枝策略。
AUC倒是知道一些。AUC是指ROC曲线所覆盖的面积,AUC大则模型的性能好。ROC曲线:纵坐标是sensitivity,横坐标是1-specificity。
Sensitivity表示在模型预测的前X%名单中,命中的个数占全部目标数量的比例。
1-Specificity表示在模型预测的前X%名单中,预测错误的个数占全部非目标数量的比例。
直观地说,sensitivity表示模型的预测目标的能力,1-specificity表示为此付出的代价。
楼上对ROC的解释是错误的吧,
ROC只是针对二元目标变量而言的,其中纵轴是sensitivity, (sensitivity主要是衡量模型判断目标事件(events)的准确率,公式是(true positive events/total actual positives);
横轴是specificity,(specificity主要是衡量模型判断非目标事件(nonevents)的准确率的,公式为(true negative events/ total actual negatives).
不过,总的观察方法是不错的,该曲线覆盖下的面积越大,表明模型效果越好!