相似文件
换一批
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
征信报告里的数据,呈现的某些数据并不能直接使用。如果数据团队里没有负责取数的同学,做模型的同学很大概率都需要自己上去加工变量。我们需要在这些数据的基础上再进一步加工。这时了解征信报告里具体的数据含义就显得非常重要,比如在某些征信报告里*N#1234567CG,都是代表着特定含义的字符。 之前做催收模型的时候,需要将还款计划切分成一期一期的还款计划表,而这份还款计划表大部分依赖于客户的还款表现切分,如征信计划表里的具体报表形式如下:
对其进行整理跟清洗后,可以得到我们以宽表展示的还款计划表,这个表在我们之前的文章里也给各位介绍过,具体的表格如下:
标准化的数据层面,我们会将数据切分成三层,基础层、业务层、报表层;刚才跟各位展示的是归为我们报表层的数据,我们会将里面的数据再细分为如下变量:在dualday是否逾期、逾期的天数等这样的变量。
再往下下沉些,到了业务层跟基础层,我们处理的数据会更偏向更基础些的数据,比如到了业务层,我们需要解释的某份征信报告的数据表示如下:
这里,我们需要了解的是最下面这条数据:
WTH,这是什么样的数据格式,这些数据代表什么含义?
请听我一一道来:这是一张标准的征信还款计划表,如果客户没有贷款或者还款记录,就会以*的格式展示,如果是有逾期并且产生坏账了,就会以呆账(G)的形式展示。
原来在我们征信系统里早就已经规定好了关于客户还款的所有的标准化定义: *-本月没有还款历史,还款周期大于月的数据用此符号标识,还款频率为不定期,当月没有发生还款行为的用&表述;开户当月不需要还款的也用此符号标识 N- 正常(借款人已经按时归还该月应收金额的全部); 1- 表示逾期1-30天; 2- 表示逾期31-60天; 3- 表示逾期61-90天; 4- 表示逾期91-120天; 5- 表示逾期121-150天; 6- 表示逾期51-180天; 7- 表示逾期180天以上; D- 担保人代还(表示借款人的该笔贷款已有担保人代换,包括担保人暗器代换部分贷款); Z- 以资抵债(表示借款人的该笔贷款已通过以资抵债的方式进行还款。仅指以资抵债部分; C- 结清(借款人的该笔贷款全部还清,贷款余额为0。包括正常结清、提前结清、以资抵债结清、担保人代还结清等情况) G-结束(除结清外的,其他任何形式的终止账户); #-账户已开立,但当月状态未知。
所以对照着,这样的逻辑,刚才展示的这张表里:
表示的含义为该客户在2013年7月份算起来的第10个月开始有贷款,但第11个月开始有逾期1期记录,第12个月逾期2期,第13个月开始往后就还清了贷款。
再如:
上例的展示记录,我们解读起来就更容易理解些,含义为:在2016年1月开始第10个月,该客户办理了一笔贷款,并且第二个月就开始逾期欠费,直至统计时点结束,仍一直处于逾期状态。
再仔细研读了征信报告,不仅还款状态有类似的标准化的编码跟上报形式。社保的缴存的方式,也是类似的格式,如:
社保里,编码如下: 0:未参保;1:正常参保,并当月缴费成功;2:正常参保,但当月缴费不成功。
还款表现非常重要,社保数据也非常重要,目前在新版征信报告里,连运营商数据都会加上,以后连水费电费等这些基础设施缴费数据都会加上,所以会解读这些符号也变得很重要。
在层级明显,组织架构庞大的组织里,每个人都只是一颗螺丝钉。兴许我们只需要把自己所在的那一层架构里的活干完就可以了。但在笔者,从事的职业生涯里,有幸大到模型建模框架搭建、上线部署,小到这篇文章里所涉及的具体提数,都需要亲力到生产库区提炼。经过这样的磨练后,也更了解底层的数据逻辑跟业务知识,对个人的成长无疑也更有帮助。
最后限于篇幅,我们将这份最完整的征信的解读放到知识星球上,部分干货如下图没在公众号里说明,有兴趣的同学可以上去解读。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|