|
设B为与x相同箱子中的示例索引集,不包括与y具有不同标签的示例i。设v(a,B)为基于x的动作值,如果与x相同箱子中的insample示例恰好包含标签为y a的示例和标签为B的示例,则会产生输出。允许iv(a,b)是将示例i添加到bin的值变化,假设| a |=aEric Bax 6和| b |=b:iv(a,b)=v(a+a(i),b+b(i))- v(a,b)。设R是(a,b)对的集合,用于添加示例i更改值:R={(a,b)|iv(a,b),0}。调用R关键集。定理4.1。带标签y的样本外输入x上示例i的Shapley值为:~O(a,b)∈注册护士n- 1a+b-1.|A | A|B | B四(a、b)。证据从表达式1开始,即第2节中Shapley值的一般方程。值v(Si(σ))和v(Si(σ)∪ {i} )仅受与x位于同一箱子中的样本内示例的影响。根据引理3.1,所有示例的相同排列数包含thosen示例的每个排序。所以n上的平均值!这些示例的置换,而不是所有示例中示例的置换。根据引理3.2,a的指数和b的指数在i之前出现的概率n- 1a+b-1.|A | A|B | B.如果发生这种情况,iv(a,b)=v(Si(σ)∪ {i} ()- v(Si(σ))。将金额限制为(a,b)项∈ R仅避免使用iv(a,b)=0,因此它对总和没有影响。作为一个简单的例子,假设我们使用一个包含所有样本示例的单箱,一个输出多数标签的分类规则,如果没有主要,则没有输出,以及一个值函数,如果分类正确,则为10 0,如果分类不正确,则为500,如果没有输出,则为0。假设示例i有标签y。如果a=b,则将示例i添加到带有标签的示例和不带标签的示例的箱子中,则不会将任何输出转换为正确的分类。
|