三方数据,一般是指外部第三平台依靠长期业务积累然后形成的具有自己特色的进行加工处理过后的数据,常见的有多头借贷的数据,支付数据,信用评分类等数据类型。
三方数据在贷前会发挥着最重要的作用,当一个客户来申请贷款的时候,如果来判断这个客户好和坏呢,除了需要金融机构自己的数据,另外就需要庞大的外部数据。
那么我们要从哪些方面去评价三方数据呢?
如何评价三方数据
三率:覆盖率、缺失率、准确率
三性:相关性、预测性、解释性
三度:区分度、重要度、稳定度
三率覆盖率:已匹配样本数量/分析总样本数量
缺失率:特征缺失值样本数量/分析总样本数量
准确率:验证一致样本数量/分析总样本数量
三性相关性:特征相关性person,spearman系数等
预测性:特征对目标变量的信息贡献度指标IV
解释性:特征分布趋势与实际业务理解是否匹配
三度区分度:模型区分度指标KS,AUC,GINI等
重要度:特征重要性系数,importance(决策树)
稳定度:特征在不同样本的分布稳定性PSI


雷达卡




京公网安备 11010802022788号







