楼主: 能者818
1092 17

[量化金融] 基于LSTM模型的点对点贷款市场风险预测 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-14 04:09:18
我们汇总的详细信息描述如下。(1) :对于目标变量loan\\u status,我们计算每月内loan\\u status的百分比=1,并将其用作aggreanalysis;(2) :对于自变量,它们都已转换为步骤(b)和(c)中提到的数值。因此,通过计算每个特征的月平均值,可以获得每月的聚合值。(d) 附加宏观经济因素:NEMP\\U利率的月值为通过匹配日期,nally与聚合的借出Clubdata合并。图4:综合层面违约风险的月度变化4.3违约风险预测4.3.1 LSTM。在上述数据预处理后,我们获得了102个综合层面的观察值以及20个变量(原始数据中的18个自变量、1个宏观经济因素和1个因变量)。我们用折线图绘制了违约率在总体水平上的趋势,从2007年10月到2010年初,违约率逐渐下降,变化较大,但之后开始增加,变化较小。采用LSTM方法对aggregatedsequential违约率进行建模。从第4.2节获得的数据集分为80%的培训和20%的测试。待规范c、 我们使用2014年6月至2016年1月的数据作为测试集。在个人笔记本电脑上安装Python 3,配备3.3 GHz Intel Core i7处理器、16GB RAM和Mac OS系统。

12
能者818 在职认证  发表于 2022-6-14 04:09:23
表1中使用的损失函数:P2P借贷交易数据集中保存的变量Feature name Description Category Typeapplication\\u Types表示贷款是个人申请还是有两个共同借款者的联合申请li Categoricalhome\\u所有权借款人的房屋所有权状态PP CategoricalVarification\\u状态表示收入是否真实由LC编制,非veried,或者如果收入来源是veriedPP CategoricalOAN\\u stat us(目标)贷款已全额支付 或违约LI Binaryannual\\u inc借款人报告的年收入PP Numericalcollection\\u recovery\\u f ee Post charge o 托收费LI Numericaldelinq\\u Amnt借款人目前拖欠的账户的逾期金额I Numericaldelinq\\u 2年借款人信贷逾期30天以上的违约率过去2年的les LI NUMERICALLI nt\\n贷款利率LI NUMERICALLI INSTALL如果贷款来源,借款人应每月支付LI Numericallast \\u pymnt\\u amnt最后收到的总付款金额LI Numericalloan\\u amnt贷款金额LI NUMERICALLOPEN \\u acc过去24个月开立的账户数CI Numericalpub\\u rec减损性公共记录数CI数字折旧后费用o 总回收LI Numericalrevol\\u bal总信贷循环平衡CI Numericaltotal\\u acc借款人信贷中的信贷额度总数le CI Numericaltotal\\u pymnt截至目前收到的总供资金额LI Numericaltal\\u rec\\u late\\u截至目前收到的滞纳金LI NumericalLSTM是预测违约率和实际违约率[]之间均方误差(RMSE)的平方根。

13
nandehutu2022 在职认证  发表于 2022-6-14 04:09:25
在培训过程中,节点、“batch\\u size”和“number of Epoch”通过试错法进行测试,目的是最小化交叉验证的RMSE。LSTM中的超参数。确定合并的宏观经济特征(unemp\\U利率)是否有益针对模式性能,实现了两种LSTM模型:(I)不使用NEMP\\U速率的LSTM模型,表示为LSTM(1);(二) LSTM模型使用NEMP\\U rate作为附加特性,表示为LSTM(2)。这是一个值得考虑的问题,让我们dent以在建模阶段同时使用所有特征。P2P借贷数据故障率,传统时间序列分析4.3。在最初的分析中,我们考虑了单变量时间序列模型(UTS,即default\\u rate仅取决于时间)和多个时间相关变量)[]。在UTS中,研究数据的自相关函数(ACF)和偏自相关函数(PACF)的图,目的是寻找最合适的时间序列模型。在MTS中,我们将最常用的方法——向量自回归(VAR)分别应用于具有和不具有附加特征unemp\\U率[]的数据集。UTS和MTS模型的实现分别基于Python 3中的R和Statsmodels库。5结果如第4.3节和第4.3.2节所述,我们rst实现了LSTMmethodology,并进一步将其性能与传统的Altime系列模型进行了比较。STM实现之前的关键步骤是超参数调整。通过应用超参数的试错值,如下所示。“节点数”的值设置为70。”通过尝试di将batch\\u size设置为50erent值范围为10到100,步长为10\'为了保证算法的收敛性,将“历元数”选为1000。

14
何人来此 在职认证  发表于 2022-6-14 04:09:28
图5和图6分别显示了LSTM(1)和LSTM(2)在每个历元期间训练集和测试集的损失值的变化。在初始训练阶段,LSTM(2)的损失小于LSTM(1),但最后,训练过程在两种模型上都会收敛。图5:LSTM(1)的训练集和测试集的损失图6:LSTM(2)的传统时间序列模型的训练集和测试集的损失是为了确保数据的平稳性。数据集被rst di通过使其具有stational。从ACF和PACF图中,我们可以看到,当PACF图将0 很快就到了Szero。因此,在我们的研究中,对于UTS,我们只保留自回归分量PAR(p)),而值的范围为1到3。AR模型的最佳值为ed作为生成最低贝叶斯信息准则(BIC)值[]的值。结果表明,在我们比较的三种AR模型(包括AR(1),AR(2))中,AR(2)产生的BIC值最低,并且无论本研究中是否选择AR(2)作为基于P2P数据的合适的传统时间序列模型,AR(2)的BIC值都比AR(2)差得多。图7显示了2007年10月至2016年1月违约率的预测趋势以及使用LSTM的真实趋势(1),cal线是使用培训数据(即2007年10月至2014年5月的数据)生成的,而右侧的趋势是基于测试集(即2014年6月至2016年1月的数据)。我们看到,由LSTM(1)和LSTM(2)生成的预测趋势非常相似。此外,两种LSTM模型都可以通过检测变化来捕捉默认趋势。我们进一步比较了三个模型的RMSE值,结果如表2所示。AR(2)给出了两个LSTM模型。因此,我们得出结论,LSTM表明其是否使用了宏观经济特征unemp\\U率。

15
mingdashike22 在职认证  发表于 2022-6-14 04:09:31
此外,由于LSTM(2)在两个训练特征上都给出了较低的RMSE值,因此unemp\\U率可以进一步提高模型性能。以上所有内容ndings可能会进一步rm THLSTM方法在连续P2P数据建模中的稳健性。表2:三个模型模型训练集测试集的RMSE比较SetLSTM(1)0.013 0.010LSTM(2)0.011 0.007AR(2)0.019 0.0216结论在本研究中,我们旨在探索美国P2P借贷市场聚合层面违约率的月度趋势。LSTMfactor在P2P市场上,我们将失业率(即unemp\\U率)作为一个额外的预测因素。结果表明,虽然LSTM在P2P市场中应用较少,但与传统的时间序列模型相比,LSTM是一种很好的替代模型。在训练和测试数据集上也证明了RMSE的降低。Di公司与以往的研究不同,以往的研究侧重于通过在聚合级别上对风险进行顺序建模来对P2P市场进行违约风险分析。因此,我们的研究成功地拓宽了LSTM算法在P2P市场中的应用。此外,我们的ndings为投资者提供了一个很好的参考,帮助他们了解P2P市场的整体状况,尤其是总体层面上违约率的月度趋势。这对他们未来的投资策略至关重要。参考文献【1】A.Bachmann、A.Becker、D.Buerckner、M.Hilker、F.Kock、M.Lehmann、P.Tiburtius和B.Funk。2011年。在线对等借贷——文献综述。《网上银行和商业杂志》16,2(2011),1。[2] 美国和中国。《互联网银行与商业杂志》17,2(1970),12–15。[3] 在线点对点(P2P)贷款中的贷款绩效。应用经济学47,1(2015),54–70。图7:违约率的预测趋势以及LSTM(1)、LSTM(2)和AR(2)的真实趋势【4】J.Foo、L.Lim和K.Wong。2017

16
可人4 在职认证  发表于 2022-6-14 04:09:35
宏观经济学和金融科技:揭示潜在的宏观经济E对等贷款的ects。arXiv预印本XIV:1710.11283(2017)。[5] A.Graves、N.Jaitly和A.Mohamed。2013年,使用深度双向LSTM的混合语音识别。在自动语音识别与理解(ASRU)中,2013年IEEE研讨会。IEEE,Olomouc,捷克共和国,273–278。[6] 格雷夫斯、穆罕默德和辛顿。2013年,使用深度递归神经网络进行语音识别。2013年IEEE声学、语音和信号处理国际会议。IEEE,加拿大温哥华,6645–6649。[7] B.Hammer和J.Steil。教程:使用RNNs学习的观点。InProc公司。埃桑。比利时布鲁日,357-368年。[8] B.Hidasi、A.Karatzoglou、L.Baltrunas和D.Tikk。2015年。基于会话的递归神经网络建议。arXiv预印本arXiv:1511.06939(2015)。[9] S.Ho、M.Xie和T.Goh。神经网络和Box-Jenkins-ARIMA模型在时间序列预测中的比较研究。计算机与工业工程42,2-4(2002),371–375。[10] 问题。神经信息处理系统的进展。473–479.[11] 在电子健康记录中。在会议记录中。计算语言学协会。北美分会。会议,2016年第卷。NIH PublicAccess,加利福尼亚州圣地亚哥,473年。[12] 计算机3(1996),31–44。[13] P.Jakubik等人,2007年。宏观经济环境和信贷风险。《捷克经济与金融杂志》(CzechJournal of Economics and Finance)(Finance a uver)57,1-2(2007),60-78。[14] J.Jurgovsky、M.Granitzer、K.Ziegler、S.Calabretto、P.Portier、L.He Guelton、andO。卡伦。2018年序列分类用于信用卡欺诈检测的阳离子。ExpertSystems with Applications 100(2018),234–245。[15] J.Kim和S.Cho。2019年,利用深度密集卷积网络预测点对点社交中的借款偿还。专家系统(2019),e12403。[16] Q.Le等人,2015年。

17
能者818 在职认证  发表于 2022-6-14 04:09:38
深度学习教程第2部分:自动编码器、卷积神经网络和递归神经网络。谷歌大脑(2015),1-20。[17] X.Li、X.Long、G.Sun、G.Yang和H.Li。2018年,《银行、云和大数据计算、人联网和智慧城市创新逾期预测》(SmartWorld/SCALCOM/UIC/ATC/CBDCom/IOP/SCI)。IEEE,中国广东,1859-1863年。[18] Z.Lipton、J.Berkowitz和C.Elkan。2015年,《序列学习复发性神经网络评论》。arXiv预印本arXiv:1506.00019(2015)。[19] 用于Inuenza趋势预测。生物信息学研究与应用国际研讨会。施普林格,中国北京,259–264。[20] M.Malekipirbazari和V.Aksakalli。2015年,通过随机森林进行的社会借贷风险评估。应用专家系统42,10(2015),4621–4631。[21]D.Marino、K.Amarasinghe和M.Manic。2016年,使用深度神经网络进行建筑能源负荷预测。在IEEE工业电子学会2016-42届IECON年会上。IEEE,意大利佛罗伦萨,7046–7051。【22】C.马里奥托。2016年,《互联网时代的借贷竞争:美国对等借贷市场案例》,见SSRN 2800998(2016)。【23】L.Molina、S.Bhulai、V.Reader、R.Jeu和J.Tjepkema。2018年。通过长短时记忆(LSTM)和自动编码器了解电子商务中的用户行为。(2018).【24】脑电信号的AR模型。2008年开罗国际生物医学工程会议。IEEE,开罗,埃及,1–4。[25](2018).[26]K.Pottar、T.Pardawala和C.Pai。2017年,神经网络分类的分类变量编码技术比较研究ers。《国际计算机应用杂志》175,4(2017),7–9。【27】任志强、胡耀华、戴耀华、王振中、徐璐、孙伟森、颜庆安。2016年。Look,Listend and Learn-一种用于说话人识别的多模式LSTM阳离子。。在AAAI中。美国亚利桑那州凤凰城,3581–3587。【28】L。

18
nandehutu2022 在职认证  发表于 2022-6-14 04:09:41
瑟格纳。2001年,奥肯定律奥地利失业与GDP的关系是否表现出结构性突破?经验经济学26,3(2001),553–564。【29】M.Sundermeyer、R.Schlüter和H.Ney。2012年。通信协会LSTM神经网络。俄勒冈州波特兰。[30]H.Toda和P.Phillips。向量自回归和因果关系:理论综述和模拟研究。计量经济学评论13,2(1994),259–285。[31]C.Wang、D.Han、Q.Liu和S.Luo。2018年。利用注意机制LSTM对点对点贷款进行信用评分的深度学习方法。IEEE Access7(2018),2161–2168。[32]B.Wiese和C.Omlin。信用卡交易、欺诈检测以及神经信息范式和应用的创新。斯普林格,231–268。[33]熊浩、商平。2017年,多变量序列的去趋势波动分析。《非线性科学与数值模拟通信》42(2017),12–21。[34]X.Ye、L.Dong和D.Ma。2018年,基于遗传算法优化随机森林的P2P借贷贷款评估不要得分。电子商务研究与应用32(2018),23–36。[35]J.Zhang,Z.Zhao,Y.Xue,Z.Chen,X.Ma,Q.Zhou。2017年,时间序列分析。《医疗统计手册》269(2017)。【36】Z.Zohrevand、U.Gl"asser、M.Tayebi、H.Shahir、M.Shirmaleki和A.Shahir。2017年,基于深度学习的关键基础设施数据预测。在2017年ACM信息和知识管理会议的筹备过程中。ACM,新加坡,新加坡,1129–1138。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 22:39