|
注意,在这种情况下,我们通过列举后验参数πy | x的两个可能值(y=0和y=1)来获得对潜变量y的期望,这也意味着我们需要在θσyanduθy中反向传播两个分量,一次一个,见图2。我们训练模型1交替目标函数l=nxilacept((x,y)i;θ, φ) - α·log E^p(x,y)[qφ(yi | xi)]+n+mXjLreject(xj;θ,φ),(12),其中E^p(x,y)是经验分布。请注意,我们将术语log E^p(x,y)[qφ(yi | xi)]引入监管下界,以利用已接受的应用程序并培训最佳可能的分类者。术语α=β·m+nn控制监督损失函数中分类的重要性,其中m和n分别是被拒绝和接受的观察数,β只是一个比例因子。3.2.1使用模型1进行信用评分时的拒绝推理不仅学习信用评分中使用的客户数据的分布p(x | z),而且还学习其潜在表示p(z | x,y)。这种潜在的表示反映了客户数据的内在结构或语义。此外,模型1近似于后验类标签分布q(y | x),我们使用后验类标签分布估计新应用的默认概率。该概率由后验参数πy | x中的互斥结果给出,后验参数πy | x由输出层具有softmax激活函数的MLP参数化。模型1在信用评分中拒绝推理的最重要特征是,通过考虑贷款在授予信用的情况下可能采取的两种状态y=1和y=0来评估未知的可编辑性(方程式10)。
|