楼主: 滨滨有利123
707 0

风控必知必会|两大逻辑表&五大基础报表 [推广有奖]

  • 0关注
  • 31粉丝

副教授

24%

还不是VIP/贵宾

-

威望
0
论坛币
198 个
通用积分
25.4545
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
9596 点
帖子
328
精华
0
在线时间
383 小时
注册时间
2015-4-26
最后登录
2024-7-21

楼主
滨滨有利123 发表于 2021-8-24 22:23:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在系统数据中,有两大重要的数据逻辑报表,分别是状态表(status)与操作日志(log表)。在这两大类型的数据报表中,状态表是经常取数交互,常用到的一张报表。比如在风控系统中,如客户是否通过审核,是否授信放款,对于客户数据在这个表里始终只有唯一一种状态,因为最终的状态都会覆盖上一次记录,大家都会对这个报表相对熟悉一些。而对于中间表(log表),因为不直接使用且在实操过程中,稍有不慎就会引发风险。

一.两大逻辑表

状态表:

记录当下时间,或者当天的状态,覆盖历史的状态。

如上述中我们提到的申请表就是状态表,申请的状态,可能下午1点的时候,在审核中,下午3点审核拒绝。但最终申请表,只记录状态,所以这个申请的状态就是拒绝,覆盖了上一个审核中的状态。

如果需要确定当时的状态,两种方式,一种是结合log表进行计算,一种是建立每天的snapshot(也就是我们常说的数据快照)。

log表:

记录从开始到现在所有的数据,有一次操作或者更新就记录一条。

例如刚刚的申请表,就可以对应一张申请的log表,点击申请按钮,直接进入审核中,增加一条记录,当审核完成增加一条审核完成的记录。所以对于日志表而言,一般都是一对多的关系。

以上的两大类型的报表,都是重要报表。开篇提到的风险,如近期跟一位同行的老师交流,他们在系统中因为不慎做了一个覆盖记录,即:将逾期结清后把逾期天数都给清零了。可以近似理解为中间的log表几乎都清空了,只保留最终状态的数据。

有同学也许会有疑问,具体场景中,清除了这个中间数据(log表)在具体场景中有什么影响?

回答这个问题,我们来看一下在贷后数据相关的策略内容中,经常会用到一些中间数据,比如某小贷跟逾期催收相关的策略有以下内容:





在以上的策略中,在月末的时候,客群都有自愈可能,但曾经的逾期的天数都是能判断客群风险的历史数据。

中间操作记录,不管是策略,也是在模型相关的特征衍生中重要的变量特征,特别是跟时间切片相关的中间变量:





说到这里的曾经逾期的数据,相关的操作记录还有涉及用中间的逾期记录去做相关的逾期客群分层分析:












以上都是中间过程数据的重要性,既然提到报表,那在风控中还有五大重要基础报表也不得不提,相关的内容分别是:注册表、个人信息表、申请表、放款表、还款表。



二.五大基础报表

注册表:PRIMARY KEY(`id`),

注册成功的客户,进入这张表。这张表的id肯定是borrower_id了

个人信息填写表:PRIMARYKEY (`id`), UNIQUE KEY ` borrower_id `,每个人,每次提交个人信息,就会有一条记录

申请表:PRIMARY KEY(`id`),  UNIQUE KEY ` borrower_id ` (` borrower_id`)。

每个人不同时间可以申请多次,每申请一次,就会有一条记录,包括申请的金额,申请结果。list_id对应了后面结果通过后是否提现,放款等。

放款表:也是还款计划表,PRIMARYKEY (`id`),KEY ` borrower_id ` (` borrower_id),KEY `idx_list_id`(`list_id`) 。

申请通过,并且放款成功的进入这张表。显示这笔借款(或者其中的某一期),应还的本金,利息,手续费,到期日等,实际是否还款,还了多少本金,利息等。但是这张表上每天的状态,假设客户今天还款100元,明天还款100元,那这张表最终会显示客户还款200元。没有办法通过这张表回溯前一天的时间点的情况。

还款表:PRIMARYKEY (`id`),KEY ` borrower_id ` (` borrower_id ),KEY `idx_list_id`(`list_id`)

实际是一张还款的log表,还款计划表的实际还款金额是根据这张表计算的来,可以知道每天的还款情况。


以上相关报表都是风控中极为重要的几张报表,后面无论我们写的滚动率、迁徙率和账龄,基本都是以基础报表为逻辑书写的内容,关于这一part我们后面还有更详细的内容分享。




~原创文章

...

end


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Snapshot Primary borrow unique status 风控大数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-4 15:44