最近有一部分同学想做评分卡模型开发,得知他们都是想从传统的风控模块或者是策略模块想转到数据建模的方向来。
转型是痛苦的,需要学习一些知识跨过自己的舒适区,起码工具这一块得先提前学习了解下。
曾经见证过一家传统的金融公司在转型之际,公司对一大波传统的信贷人员开刀。所以未雨绸缪总是好。
转型做模型或者策略都是不错的方向。
某些消费贷公司,由于产品额度低、周期短、客户体量大,靠人工已经基本不可能支持公司的运营了。这些类型的公司基本已经砍掉传统审批的团队,人工审批的人数是0。
比如X聚盈,一家P2P公司,18年时候整个风控团队加起来是5个人,1个领导+2个模型+2个策略。而且领导和2个策略的同事是要同担批核的任务。
5个人的风控团队,这在传统的信贷行业看来是很不可思议的。在很多传统公司里,起码都是几十个人的配置。传统公司里,会把Underwriting+MIS+催收,合在一起构成整个风控,单单催收就有十几二十号人。而在这家纯P2P公司里,完全不同,自家公司的催收人员占比非常少,只催DPD7内的。只要超过DPD7,马上交给催收公司。
传统的机构,人力成本负担太重,已经严重拖垮了整个公司的运营。互金公司,基本已经是非常轻资产运营了。
虽然目前仍然是个弱人工智能的时刻,在信贷领域也是偏策略居多,但是不排除以后会随着数据丰富与多样性,模型可以完全占大头,或者完全替换掉策略,最后实现强人工智能来根据风险偏好主动筛选客户。
说到这个就突然想起来了,前阵子突然很流行的量化投资,某机构用人工智能替客户选了一部分股票,结果碰到了政策面,股市一片哀嚎!股市能预测的到的吗?特别是中国的股市。
回归主题,策略跟数据当然在风控领域是相当关键的,有些公司完全做这方面的轻资产转型了,但是目前还是有一些问题存在。从一些做过的项目里挑一些普遍的现象:
一:自家的数据不足
曾经参与过一些模型冷启动的项目,了解到目前一些传统行业的巨头,比如华润、美的 金蝶,连富士康这样的企业都在跨板块经验。
当然这些公司大部分都是成立一个金融事业部如果后期运作良好便独立运营为一个金融子公司。但是由于是跨板块经营的,所以苦于前期确实没有大量模型样本,而且重要的是数据获取权限也是个大问题。
前期能出来一个精准的模型,用脚想想也知道。比如说HuaRun,对外宣传手里有将近一两千万的优质资产在手,想做批额在十几到三十几万的产品,前期就想开发模型。他们这些客户都是一些在自己渠道里持有的客户,各种跟社区绑定的用户,据说还有HuaRunTong这样的商城数据能获取。
我们不说用户对他们家社区的粘性有多少,就是一个金融子公司要想有权限获得集团的数据,想想也不是件容易的事。
鉴于此,模型只能靠冷启动进行。什么叫冷启动,业内叫暴力建模,所以模型的效果从字面都可略知一二。
二:公司的数据化平台建设
公司的数据化平台建设,是和我们的数据提取相关的。一个大型的信贷平台,至少包括的系统有以下几部分:(当然这部分我在之前的文章里也有涉及到:风控建模:催收评分卡(四)--变量整理除了跟数据获取相关外还跟什么有关系?)
· 核心系统:存储客户的账务信息,还款计划,还款流水等;完成客户开户、放款、冻结额度等操作
· 客户端系统:客户在使用终端的一些交互内容,与后台逻辑;将对应的数据存储
· 数据计算平台:满足风控实时审批过程中需要变量的实时计算,对接业务范围内审批需要的内部系统数据
· 征信平台:统一对接所有外部数据源,进行统一管理;满足审批过程中的灵活调用
· 审批系统:组织所有风控吸配合完成审批;告知核心客户与放款
· 资管系统:匹配开户资金方与放款时资金方的选择;P2P模式中单个资产的撮合
· 服务端系统:客户在终端上操作的行为与数据的留存;与风控系统交互
· 决策引擎:承接风控策略的部署;出具审批的决策建议
· 反欺诈系统:主要做关系网络的生成与衍生变量的计算;定义网络中节点的黑白
当然以上是最理想的一个风控系统,然后在实际中,我们平时工作中的最常涉及的可能就是某几个系统而已。
为了帮助大家理解,我举一个稍微简单点的案例:比如审批系统是经常会跟征信平台进行交互的,但是当征信平台出现调用外部数据源异常的时候,这时该怎么处理?
1.找一个备用数据源。但是目前该数据源是仍在生产库中的数据源,找备用数据源就会造成卡单情况。
2.空跑。如果是刚好调用的是黑名单,那这个客户就会被绕过去。
3.挂起来。才用人工干预的方式,并且把这个节点进入到差错中心里,进一步等待人工审核。
思考下,上面哪个才是正确答案。
所以扯回来,公司的IT平台建设能力跟数据埋点能力才是和我们的数据能否有效获取息息相关。
试想一下,我们在做某条策略的时候,想取用户在最近一个月使用app的次数,突然被IT部门告知接口没有开发好,或者因为权限不足没有获得客户的授权,导致这个数无法获取。
相关应用需要在下次版本更新的时候迭代完成,下次迭代的时间是在1个月后。好好想想,遇到这种情况还能怎样取数…..
归根到底,公司的系统平台的数据化建设,都是跟前期的架构有很大关系。如果在之前的某些系统功能因为设计和架构的缺陷导致无法实现,之后也就只能舍弃了某些平台,从新开发需求。
好运的是,该系统前期留好端口,咱们之前提的需求:获取一个3期的产品的客户在夜间手机的使用轨迹,也许加急做个需求就能顺利开发完成。
如果悲剧点,被告知系统层面根本不支持该功能,只能另外开发新平台。
但更悲剧的是新平台建设好了,但是因为金融业务迭代快,之前的三期产品已经不再运营,目前已经需要上线更长周期12期的贷款产品,再发现新平台依旧不能满足目前的某些功能,又需要IT在新系统上继续开发新的需求。
循环的怪圈像在开玩笑,咱们还怎么做事。
反正见证的公司已经不止一次出现过这种问题了。
三;外部公司的数据支持
多头、反欺诈、黑名单、这些外部数据都是很好的支撑,是对公司自身数据的很好的一个补充,目前很多金融公司非常依赖这样的公司提供数据的。
但是这些公司部分数据参差不齐,大的平台商可能还好,因为他们能跟一手数据产商合作,拿到最前端数据,但是一分钱一分货啊,价格也是忒贵的。数据方一般能被大家使用的,一般也就那么几家。但对于一些实力有所欠缺的公司,只能跟非一手产商合作,而这些非一手产商,是很少会标配自己的数据是二手的。
一手数据跟二手数据的区别时什么呢?