楼主: 能者818
1304 32

[量化金融] 手机使用行为预测贷款还款 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-6-2 18:53:21
图1显示了违约率如何随接受的借款人比例变化(预测违约率最低的借款人首先被接受)。接收机工作特性曲线(ROC)绘制了分类器的真阳性率与假阳性率的对比,跟踪了接受率变化时的性能。根据信用评分文献,我们报告了该曲线下的面积(AUC),以总结可能接受阈值范围内的绩效。一个天真的分类器将生成0.5的AUC,而一个完美的分类器将生成1.0的AUC。图2说明了最佳基准模型(逐步logistic)和最保守模型的ROC,使用的指标来自电话数据(随机森林每周集合)。表3给出了各种规格的结果,用AUC测量性能。(使用表S3中的替代指标评估绩效)。将显示整个样本的结果,然后是有和没有信贷局记录的子样本的结果。在这类有thinfiles的人群中,信贷局信息在预测还款方面表现不佳(AUC 0.51-0.57)。对于局指标,logistic模型优于随机森林,表明这些指标与还款之间的潜在关系是相对线性的。相比之下,标准型号builton phone indicators(CDR)具有预测性,在同一时间段进行培训和测试时,AUC达到0.71-0.77。我们更为保守的CDR-W模型在同一时间段(AUCs 0.62-0.63)进行培训和测试时,性能较低,但也优于信贷局模型。我们的模型的表现也在已发布的发达国家传统信贷蔑视传统贷款的实时AUC估计样本范围内(0.50-0.79,如表S4所示)。

22
可人4 在职认证  发表于 2022-6-2 18:53:24
我们的方法在手机使用量的每个四分位数内的总体性能都是相似的,这表明它在使用量上比总体使用量有细微差别(见图S2和Bj"orkegren and Grissen(2018))。结合我们的指标信贷批准决策,往往会批准分数高于阈值的申请人。AUC对于这些类型的决策有两个有用的属性:它们只考虑观察值的相对排名,并且跟踪潜在阈值的范围。信贷局提供的信息略微提升了绩效,这表明信贷局收集的信息与我们的方法收集的信息只是略有补充。稳健性检查评估了用表S2中的10倍交叉验证代替训练的模型,这会消耗更多的样本,但计算要求更高。这尤其提高了CDR模型的性能,因为这些模型更复杂,因此需要大量数据。它们的性能也可能通过额外的调整得到改善。当使用其他绩效指标进行评估时,我们的方法的表现也优于信贷局模型,这些指标为我们的决策问题提供了信息;特别是,设计的H度量克服了AUC(Hand,2009)和样本外R的一些缺点(见表S3)。主要模型的ROC曲线如图S4所示,得分与实际还款的比较如图S5所示。过期实施后,将使用根据过去数据训练的模型预测未来还款。作为arobustness检查,我们通过在不同时间段进行培训和测试来评估所有模型的超时性能。为此,我们构建了数据集的偏移版本。

23
kedemingshi 在职认证  发表于 2022-6-2 18:53:27
个体样本被分成两部分;早期组在中位日期之前过渡,晚期组在中位日期之后过渡。然后,将电话数据平均划分为早期和晚期。我们只使用这一半数据中发生的事务(直到每个转换的日期)来构建ourindicator的偏移版本。由于这些偏移指标构建在较短的面板上,因此它们捕获的信息比我们的完整指标少。该模型在早期组进行训练,电话指标来自电话数据的早期阶段,并在后期组进行测试,指标来自电话数据的后期阶段,结果见表3的最后一列。因为只有一个后期测试,所以超时结果比在时间内结果暴露在更多的噪音中(性能可以通过多次折叠图进行评估)。因此,这些过期结果应该被视为只是粗略检查一个人应该相信多少时间内的结果。基于统计局数据的低维模型随着时间的推移趋于相对稳定。另一方面,使用电话指标的标准模型出现严重恶化(随机森林的AUC从0.71下降到0.63,逻辑逐步下降的AUC从0.76下降到0.60)。我们改进的仅使用周内变化的phoneindicator模型更加稳定(随机森林的AUC从0.62增加到0.64,逐步OLS-FE的AUC从0.63减少到0.59)。所有电话指标模型继续优于使用信贷局数据的模型,这部分数据(AUC 0.55-0.58)。我们的绩效也在一个可比的公布基准范围内,即我们可以在文献中找到的传统信用评分的过期绩效,从一个发达的环境(AUC0.57-0.76,表S4)。

24
何人来此 在职认证  发表于 2022-6-2 18:53:31
这些和我们的结果表明,当测试超时时,局模型可能会面临至少轻微的恶化,但需要注意的是,我们只测试了一个时间段。当在多个队列上进行培训时,我们的方法的超时性能预计会得到改善(只是信贷局通过观察多个队列的默认模式来改进他们收集的数据)。试验结果出来后,电信公司使用与我们建议的相似的数据和方法实施了一个评分系统,这表明他们认为这是有利可图的。5、讨论手机数据似乎量化了通常被认为是软的行为的细微方面,使这些行为变得“硬”起来,并使正式机构易于辨认(Berger&Udell,2006)。此外,这些数据已经被捕获。这种方法可以通过多种方式帮助穷人提供金融产品。CDR-W随机森林模型在同一时间段内进行交叉验证时,可能表现不佳:当等效样本量在多个时间段内被分割时,其获得的结构较少(如样本外测试,该测试在数周内对贷款的

25
mingdashike22 在职认证  发表于 2022-6-2 18:53:34
我们的合作伙伴选择的用户在电话上的花费比国内的普通电话用户多。我们评估图S2中的选择。我们还评估了在Bj"orkegren和Grissen(2018)的两次练习中,稀疏用户的性能会恶化的程度,这两次练习复制并更新了该图。首先,我们比较了样本中四分位使用率之间的性能;我们的方法在花费较少的用户中的表现并不差。其次,我们通过从数据集中删除事务来构建一个合成数据集,以匹配较轻用户的支出。这些合成数据集模拟较轻用户在我们观察到的同一时间段内可能进行的事务数。每月支出接近1美元(减少96%的交易),绩效下降。我们预计,如果对较轻用户的观察时间超过我们观察到的16周的中位数,他们的性能将得到改善。这些结果表明,该方法可能能够可靠地通过电话使用的大部分分布对个人进行评分。我们的方法可以大大降低在银行系统边缘对个人进行筛查的成本。当发展中国家的穷人能够获得贷款时,他们往往会通过详细的访谈或同龄人小组等代价高昂的方法受到筛选。相比之下,我们的方法可以以极低的成本实现,并且可以在移动电话网络上执行,而无需物理交互。这些方法可以实现新的借贷形式,而不需要当前分行借贷的完整结构,例如数字信贷。

26
可人4 在职认证  发表于 2022-6-2 18:53:37
数字信贷既可以降低服务现有市场的成本,也可以使其在当前金融体系之外为消费者提供服务变得有利可图。实施如所示,这种方法可用于在已经拥有必要数据的公司内扩展电信特定信贷。然而,应用范围要广泛得多。移动货币让人渴望发放贷款和收取一般付款。经监管部门批准,电信公司可以连接银行业,并向消费者提供贷款。或者,电信公司可以将这些数据打包成creditscore,第三方可以通过手机银行平台或独立的creditbureau使用。第三种实现是智能手机应用程序,它允许第三方独立于电信运营商访问使用数据,目前已有多家初创公司在探索这一技术。这些应用程序要求获得查看通话历史记录和其他行为数据的权限,并可以在设定的时间段内收集实时数据。我们的绩效评估来自提供后付费信贷。如果电话使用情况对这种形式的信贷的还款提供了特别的信息,那么在预测其他形式的贷款违约时,表现可能会有所不同。但通过手机发放的一般贷款与我们研究的支付后信用有相似之处。两者都可以远程扩展,无需人工交互。如果普通贷款无法偿还,电信公司还可以向信贷局报告借款人,还可以冻结一个电话账户或从移动货币余额中扣押资金(根据监管规定)。除了协助向后付费计划过渡外,此方法还可用于延长手机购买的信用,或保持一致的通话时间平衡。

27
mingdashike22 在职认证  发表于 2022-6-2 18:53:40
许多发展中国家的运营商提供这样的小额广播贷款;评分模型可以改善他们的供应。例如,请参见Jumo。例如,请参见Cignifi。例如,请参见Tala和Branch。这种担忧的一种表述是,如果大量手机用户愿意做更多的事情来避免手机账户关闭,那么这种方法只会检测手机使用水平。在这种情况下,它可以更好地预测何时偿还电话费,而不是一般贷款。然而,如本文和图S2所述,该方法在每四分之一的使用量中都取得了类似的性能,并且在我们有足够使用量的样本中,广播时间使用量和还款之间的相关性非常小(-0.03)。或者,与普通贷款相比,统计局的信息对这种形式的信贷的预测性较差,因为普通贷款会降低基准利率。局信息将代表支付后信贷延期的现状。在低收入人群中,统计局信息的表现没有多少证据;此处观察到的绩效处于较发达地区普通贷款公布估计范围的较低水平(表S4)。然而,bureau informationPrivacyPrivacy在任何实施中都将是一个关键考虑因素。如本文所示,通过匿名化连接电话和借阅数据的标识符,可以使用匿名数据估计取芯模型。然而,要为贷款决策生成预测,该模型必须基于潜在借款人的数据运行。可以设计一个实现来减轻隐私风险。它可以选择加入,因此只有同意的消费者才能使用该系统进行评分。它只能向贷款人揭示一个单一的数字来概括违约风险,而不是描述行为的基本特征。

28
可人4 在职认证  发表于 2022-6-2 18:53:43
此外,可以限制使用不太敏感的功能,例如充值行为,而不是个人联系人的网络结构。操纵某些指标是“可玩的”,即订阅者如果知道算法,就可以操纵他们的分数。操纵的可行性取决于最终模型的复杂性和单个指标对操纵的敏感性。模型的两个维度都可以调整,以减少操纵的可能性。例如,最好使用不易受影响的指标(例如,操纵支出或旅行可能会代价高昂)。本文的子组绩效异质性扩展评估了不同子组的绩效(Bj"orkegren&Grissen,2018),如图S3所示。该模型针对除省略折叠外的所有个人进行训练,并在省略折叠内报告给定亚组(女性、男性和首都内外的居民)的表现。尽管我们的误差条可能很宽,但在不同的群体中,表现并不是广泛的异质性,这表明该方法可能能够对不同类型的个体进行评分。无法用于对感兴趣的总体进行评分,而我们的方法在此范围内以更高的性能级别对该总体进行评分。选择加入的潜在借款人可能会从更广泛的人群中进行差异选择,在这种情况下,根据更广泛人群的非真实数据估计的模型可能不适合在实践中使用。系统运行后,可以定期根据选择加入的借款人的结果进行重新调整。(这一点要感谢一位匿名裁判)。如果在许多发展中国家,多个用户共享每个手机账户,那么个人共享手机可以降低费用。

29
能者818 在职认证  发表于 2022-6-2 18:53:46
当一个电话帐户在多人之间共享时,此方法将为该帐户生成一个分数。如果共享实践在设想和实施之间没有差异,该方法仍将产生一个无偏的账户所有者还款预测值。在这种情况下,该方法将捕获手机所有者以及他们选择与之分享的人的行为(实际上,选择与谁分享也可能与还款相关)。另一方面,如果每个用户都有多个移动帐户,那么在竞争激烈的移动市场中,每个用户都可以使用多个帐户,以利用跨多个网络的网内定价优势。这种做法对于GSM手机上的prepaidplans(主要是边际费用)来说很方便(允许轻松交换SIM卡或可能有双SIM卡插槽)。当用户在多个网络上划分呼叫行为时,从单个运营商收集的数据将只代表其电话的一部分。虽然这将使他们的数据更加稀疏,但只要实践在估计和实施之间没有差异,就不会在方法中引入偏差。如果个人在单个手机上使用多个帐户(如果手机支持双SIM卡或用户交换SIM卡),则通过应用程序从该手机收集的数据可以衡量所有帐户的活动。结论本文展示了一种利用手机使用所揭示的行为模式预测没有正式财务历史的借款人违约的方法。我们的方法可以预测中等收入人群的违约情况,因为中等收入人群往往只有很少或根本不存在的信贷局文件。在这个至少有适度手机消费的人群中,我们的方法比信贷局模型表现得更好。但我们的方法也可以对正规金融体系之外的借款人进行评分,而传统方法无法对这些借款人进行评分。

30
mingdashike22 在职认证  发表于 2022-6-2 18:53:49
它还可以很好地处理较轻的手机用户生成的稀疏数据。虽然本文的重点是预测还款,但这类数据可以揭示更广泛的个人特征(Blumenstock et al.,2015),并可以用来预测其他利息结果,如终身客户价值或贷款的社会影响。人们普遍认为,手机可以在发展中国家实现低成本的转账和储蓄(Suri、Jack和Stoker,2012)。我们的研究结果表明,手机使用过程中捕捉到的细微差别可以缓解信息不对称,从而为新形式的低成本贷款奠定基础。这些工具共同促成了数字金融服务的新生态系统。7、参考文献Arráiz,I.、Bruhn,M.、Stucchi,R.(2017)。心理测量学是改善信用信息的工具。世界银行经济评论,30(补编1),S67–S76。https://doi.org/10.1093/wber/lhw016Berger,A.N.,&Udell,G.F.(2006)。更完整的中小企业融资概念框架。《银行与金融杂志》,30(11),2945–2966。Bj"orkegren,D.(2010年)。“大数据”促进发展。CEPR/AMID暑期学校会议录。恢复fromhttp://dan.bjorkegren.com/files/CEPR_Bjorkegren.pdfBj"orkegren,D.,&Grissen,D.(2018)。数字信贷对穷人银行的潜力。美国经济协会文件和会议记录。Blumenstock,J.、Cadamuro,G.、On,R.(2015)。从手机元数据预测贫困和财富。《科学》,350(6264),1073–1076。Breiman,L.(2001年)。随机森林。机器学习,45(1),5–32。https://doi.org/10.1023/A:1010933404324Breiman,L.,&Cutler,A.(2006年)。随机森林。检索自http://stat-www.berkeley.edu/users/breiman/RandomForestsButler,D.(2013年)。当谷歌把流感搞错的时候。《自然新闻》,494(7436),155。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-11 13:10