这使用“观测配对”来评估模型。
观测配对是从数据集所有的目标事件中取一个观测数据、从所有的非目标事件中取一个观测数据,构成一对观测。
n个目标事件
N-n个非目标事件(N为总观测数)
存在n*(N-n)=P种观测配对组合,即pairs
如下几个定义:
协调配对:从目标事件中抽取的观测的模型预测值 > 从非目标事件中抽取的观测的模型预测值
不协调配对:从目标事件中抽取的观测的模型预测值 < 从非目标事件中抽取的观测的模型预测值
平分配对:从目标事件中抽取的观测的模型预测值 = 从非目标事件中抽取的观测的模型预测值
协调配对组数/P=Concordant;不协调配对组数/P=Discordant;平分配对组数/P=Tied
Somers'D=Concordant-Discordant
Gamma=(Concordant-Discordant)/(Concordant+Discordant)
Tau-a=(Concordant-Discordant)*P/(0.5*N*(N-1))
C=0.5+(Concordant-Discordant)/2
总之,模型越好,协调配对的占比就越大,不协调配对的占比就越小,上述四种统计量也就越大。


雷达卡






京公网安备 11010802022788号







