楼主: nandehutu2022
1712 35

[量化金融] 可持续投资与最大水位下降截面 [推广有奖]

21
大多数88 在职认证  发表于 2022-6-23 22:28:08
然而,这种做法成本很高,并且不尊重事件的时间顺序,这对我们的分析至关重要。由于我们评估了一年期内的最大水位下降,并将开始日期错开了一个月,因此N年期包含12×(N- 1) 观察结果。2.3性能和特征重要性性能度量旨在评估统计模型,通常报告样本外(OOS)数据,即未用于校准模型的数据,以避免过度拟合。在最佳情况下,模型的预测应尽可能接近实际结果。可以使用预测值和实际值之间的误差度量来解释结果。在我们的分析中,因变量的非平稳性导致预测值和实际值之间的量级不同,从而导致显著误差。尽管我们可能会在这种情况下失败,但我们仍然可以在预测值和实际值之间建立一种关系,我们可以在散点图上观察到这种关系,并且可以通过考虑“一致性”度量来指出这种关系。决定系数或R平方通常用于回归分析,它衡量因变量中的方差比例,可从自变量中预测。然而,根据我们的经验,除了异常值外,R平方对实际和预测变量中的不同量级也很敏感。我们通过报告两个指标来取代后者;平均绝对误差和Lin的一致性相关系数。

22
mingdashike22 在职认证  发表于 2022-6-23 22:28:11
第一个指标是准确度的衡量标准,与数据量成正比,而第二个指标则报告了两个变量之间的一致程度,并与皮尔逊相关性成正比。我们回顾平均绝对误差(MAE)的公式:MAE=#TX(i,t)∈T | yi,T+1-byi,t+1 |,其中t表示试样。MAE度量对异常值的鲁棒性高于平方误差,MAE的值与数据在同一尺度上。它是误差的一种量度,因此MAE最小的模型更接近水位下降的幅度。Lin的一致性相关系数(CCC)见【Lin等人,2002年】,是两个变量之间一致性的度量,定义为:CCC=1-E[(y-^y)]E[(y-^y)|ρ=0]。Lin的CCC使用均方误差(MSE),即e[(y-^y)],以及它的条件版本,即e[(y)]-^y)|ρ=0],在两个变量之间没有关系(ρ=0)的情况下测量平方距离,以获得-1和1。当CCC=1时,可以实现完美匹配,而CCC=0则意味着预测值和实现值之间没有关系。在数值上,CCC的值通过以下方式从样本中估算:CCCV=2ρσyσ^yuy- ^y+ σy+σ^y,其中σy是y的方差以及y和^y之间的ρPearson相关性。对于MAE,测量值在测试集T上计算。特性重要性的概念是衡量当特性不可用时,性能度量分数降低了多少。一个潜在的解决方案是从数据集中删除特征,用其他估计器重新训练模型,并测量性能。一方面,此解决方案需要重新训练,并且可能需要大量计算。另一方面,它显示了在数据集中,而不是在给定的训练模型中,哪些特征是重要的。

23
可人4 在职认证  发表于 2022-6-23 22:28:15
最后,虽然一些模型允许对给定变量的重要性进行隐式测量,例如线性回归模型的回归系数,但更复杂的模型(如神经网络)缺乏这一特性。为了解决统一框架中特征的重要性,【Ribeiro等人,2016年】提出了“局部可解释模型不可知解释”。他们的方法依赖于经过训练的局部代理模型,以近似于基础黑箱模型的预测。代理模型可以是任何可解释的模型,如线性回归或决策树。在对月收益可预测性的分析中,【Gu等人,2018年】通过将所选变量的所有值设置为零,并保持其他变量的值固定,通过还原来衡量变量的重要性。[Wei等人,2015年]回顾和比较了一大套方差重要性模型(VIM)的方法,包括基于差异的VIM、假设检验技术或基于方差的DVIM。这些方法背后的直觉是,模型的决策标准越依赖于某个特征,预测随着该特征的扰动而发生的变化就越大。在我们的分析中,我们采用了被称为“置换重要性”的方法,通过测量当使用与原始特征值相同的分布中提取的随机噪声替换特征时,分数如何降低,参见【Breiman,2001】和【Altmann et al.,2010】。3实证研究我们从纽约证券交易所、美国证券交易所和纳斯达克上市的股票的WRDS和OWL分析中收集月度数据。在计算一年期远期最大水位下降后,我们获得了一组数据,从1980年1月开始,到2017年6月结束,共计450个月。

24
可人4 在职认证  发表于 2022-6-23 22:28:18
我们总共解释了96个特征,包括16个ESG分数、5个二元变量和1个分类变量,其中9个领域的结果(基于彭博分类)。一方面,通过将最大提取量作为因变量,另一方面,将具有重定标公司特征的矩阵作为预测因子来进行回归。将(原始)预测器重新缩放到公共级别,部分解决了原始预测器的非平稳性,从而改善了样本外结果。在对线性模型(LM)、Lasso、Ridge、弹性网(ENet)、RandomForest(RF)、偏最小二乘(PLS)、主成分回归(PCR)、极端梯度增强树(XGBoost)和多层感知器(MLP)九个模型进行训练后,我们比较了基于无样本性能度量的结果。3.1最大水位下降的横截面3.1.1没有ESG数据的第一次分析由于ESG数据始于2009年,我们在第一次分析中省略了ESG分数,在第一次分析中,我们使用其他80个变量测试模型。这使我们能够在包括2008年危机在内的更大测试集上进行分析。培训计划于1980年1月开始,2006年3月结束,而测试计划于2007年3月开始,2017年6月结束。绩效在图4中,我们报告了所有股票的MAE和CCC指标,以及按市值排列的前四分位和后四分位。MLP取得了最好的业绩(MAE=14.21%),我们还对一年期无风险超额收益率进行了类似的分析。虽然这些结果在本文中没有详细说明,但它们在整个结果部分的脚注中进行了总结。CCC=51.28%,其次是XGBoost(14.27%,CCC=48.28%)。

25
能者818 在职认证  发表于 2022-6-23 22:28:22
从一个模型到另一个模型,MAE的值相对接近,而我们注意到不同模型之间CCC测量的差距更大。图4:总体MAE和CCC面板(a)、(b)和(c)中的表格和图报告了2006年3月至2017年6月期间所有股票的样本MAE和CCC,以及按市值排序的股票顶部和底部四分位数。报告了九个模型的结果:普通最小二乘法(OLS)、套索、岭、弹性网(ENet)、偏最小二乘法(PLS)、主成分回归(PCR)、随机森林(RF)、XGBoost和多层感知器(MLP)。(a) 样本外MAEOLS Lasso Ridge-ENet PLS PCR RF XGBoost MLPall 14.46 14.46 14.50 14.46 14.52 14.57 14.27 13.99顶四分位13.24 13.24 13.34 13.24 13.27 13.22 13.20 13.13 12.47底四分位15.14 15.23 15.14 15.46 15.32 15.41 15.03 14.75(b)样本外CCCOLS Lasso Ridge-ENet PLS PCR RF XGBoost MLPall 46.71 46.68 46.69 75 46.52 46.77 48.65 50.53顶部四分位29.30 29.27 29.14 29.29 29 29.60 30.52 34.09 33.67 34.33底部四分位52.57 52.54 51.71 52.55 51.97 51.68 47.92 51.83 54.17(c)样本外MAE(左)和CCC(右)的条形图之前的结果是在整个样本期内汇总的,它们不会告诉我们模型何时表现不佳以及何时给出了合理的估计。为了研究这个问题,我们计算了培训期间每个日期横截面上的绩效指标,从而得出样本外绩效指标的时间序列。结果如图5所示。毫无例外,所有模型在2008年金融危机期间都表现不佳。虽然MAE比正常值翻了一番多,但CCC仍为正值(略高于17%)。

26
能者818 在职认证  发表于 2022-6-23 22:28:25
该值表明,尽管性能不佳,但预测和实现的最大水位下降之间的一致性仍然存在。为了进一步检查这一说法,我们根据预测的最大下降量,将每个日期的库存分为10个分位数。然后,我们绘制了股票已实现减持的经验分布图。对于一年期超额收益的情况,MAE较大,因为噪声信号比较高。查看一致性度量CCC,我们发现非线性模型的表现略优于线性模型。随机森林的表现最好(9.9%),其次是XGBoost(8.86%)、MLP(7.78%)、PLS(8.01%)、PCR(7.5%)和OLS(7.74%)。与最大提取量类似,2008年危机前后的时期是所有车型表现最差的时期。CCC达到负值,MAE达到90%。在温和的市场条件下,CCC的价值变化约为15%,在2015年3月左右达到24%,而MAE的变化约为35%。基于树的模型显示出略好的结果图5:2007年3月至2017年6月期间MAE(左)和CCC(右)的时间演变图6:预测的基于MDD的分位数的实现MDD分布q1,。。。,q10是使用2008-04-01和2015-04-01两个日期的预测MDD的经验分布形成的。然后,对于MLP方法,在这些周期内显示每个分位数的已实现MDD的分布。图6显示了两年内预测和实现的最大水位下降之间的关系。对于每个时期,根据预测的最大下降量,将股票分为十个分位数,并绘制了实现的最大下降量的分布图。第一阶段(2008年4月1日至2009年3月31日)包括金融危机,而第二阶段(2015年4月1日至2016年3月31日)市场状况较为平静。

27
可人4 在职认证  发表于 2022-6-23 22:28:28
在平静期,不同分位数的密度更为明显。然而,在危机期间,中间分位数往往重叠,然而,极端分位数仍然很好地区分。特征重要性为了探索不同企业特征的预测能力,我们计算了测试期间每个模型中前20个变量的特征重要性分数。如图7所示,这些结果表明,平均而言,规模(mve)、波动率(retvol)、买卖价差(baspread)、beta和交易量(dolvol)是主导因素。而被认定为“重要”的功能往往比其他型号具有一致的性能。对无风险利率超额回报率的相同分析表明,不同分位数之间的区别较小,但较低分位数的平均回报率低于较高分位数,但2008年后的危机除外,在2008年后的危机中,顺序颠倒了。在不同的模型中,(自然)存在一些差异。例如,股息收益率(dy)对XGBoost非常重要,而与其他车型相比,规模非常低。预测因子和结果之间的关系,预测MDD,也提供了信息。例如,我们的结果表明,规模较大的公司和交易量较高的公司(dolvol较高)的提款倾向于较低的提款,而波动性较高的公司、出价askspread或beta的提款倾向于较高的提款。图7:不同模型的特征重要性图报告的特征重要性由解释方差的敏感性确定。

28
mingdashike22 在职认证  发表于 2022-6-23 22:28:31
在2007年3月至2017年6月的样本外期间,报告了九种车型中每种车型的值。我们区分了预测因子和输出之间的负关系(红色)和正关系(黑色)。3.1.2 ESG数据对最大水位下降横截面的影响在调查了非ESG公司特征预测大型测试集最大水位下降的能力后,我们重复分析,将ESG添加到混合物中。我们的目标是确定可持续性指标是否能够提高我们预测最大缩编的能力。由于ESG数据仅在2009年才开始受挫,我们不得不扩展我们的培训集,以包括金融危机,使模型更容易表现良好。因此,从1980年1月到2013年6月的时间段用于训练模型,从2014年6月到2017年6月的时间段用于测试模型的性能。由于线性模型在缺失值方面的局限性,我们将分析限制在非线性模型上;i、 例如,随机森林、XGBoost和多层感知器。与之前一样,我们比较了基于样本外平均绝对误差(MAE)和林氏一致性相关系数(CCC)的结果。在这种情况下,我们测试了企业特征的两种备选方案;在之前的分析中使用的80个特性,以及一个包含常用变量的精简版本(共12个)。我们还将16个ESG变量分为三种情况。

29
大多数88 在职认证  发表于 2022-6-23 22:28:34
这些案例的符号和定义如下:oFC:所有公司特征(80),无ESG得分。o调整后的FC:一组经过调整的十二个公司特征:部门、账面市值(bm)、波动率(retvol)、贝塔、规模(mve)、股本回报率(roeq)、资产回报率(roaq)、动量(mom1m、mom6m、MOM1200和MOM360M)和收益价格比(ep)re-E/S/G:非汇总环境、社会和治理得分,共计12分。o环境/社会/治理:主要的三个环境(E)、社会(S)和治理(G)得分,这是前十二个得分的增加ESG:单个ESG分数,平均之前的E、S和G分数。性能在图8中,我们报告了随机森林(RF)、XGBoost和多层感知器(MLP)的MAE和CCC。我们区分了前面详述的8个案例。我们将新结果与前一节的结果(使用扩展测试集)进行比较,以衡量测试周期选择的影响。短测试集的性能更好。这一结果并不令人惊讶,因为较短的测试集排除了金融危机。性能最低的模型为RF:MAE为12.19%~13.14%,CCC为56.94%~15%。61.11%XGBoost和MLP的性能都优于RF。XGBoost的MAE值较低(在“修剪FC+E/S/G”的情况下为11.41%,而在“修剪FC+E/S/G”的情况下为11.90%),然而,当包括所有公司特征时,MLP的CCC值较高(在“FC+E/S/G”的情况下为64.19%,而在“FC+E/S/G”的情况下为62.04%)。这些结果表明,XGBoost更倾向于过度匹配更大的预测因子。总体而言,ESG变量提高了两个模型的性能。XGBoost的最佳性能为“修剪FC+ESG”(11.36%MAE和63.35%CCC),MLP的最佳性能为“FC+E/S/G”(分别为11.79%和64.19%)。对于超额回报,基本情况下(无ESG得分)的CCC变化约为14%。

30
nandehutu2022 在职认证  发表于 2022-6-23 22:28:37
当会计forESG得分以绝对值的3%左右(相对值的15%)增加时,它会增加。aggregateESG指标和更详细的分数之间的性能差异非常小。另一方面,当考虑ESG数据时,MAE在33%左右变化,XGBoost略有下降。图8:总体MAE和CCC表和条形图报告了总体MAE和CCC,并涵盖了非线性模型,即随机森林(RF)、XGBoost和多层感知器(MLP)。我们在选择没有ESG变量的企业特征时区分了两种情况;FC用于所有特性,修剪FC用于行业中常用的十二个特性,以及选择ESG变量集以添加到特性中的四种情况。这导致在分析中报告了八个不同的病例。除FC0外,所有案例都使用从2014年6月到2017年6月的测试期,而FC0对应于从2007年3月到2017年6月的前一个测试期。(a) 样本外MAE和CCCMAE CCCRFXGBoost MLP RF XGBoost MLPFC0 14.5714.57 14.57 46.77 46.77 46.77FC 14.2714.27 14.27 48.65 48.65 48.65FC+重新定义-E/S/G 13.9913.99 13.99 50.53 50.53 50.53FC+E/S/G 12.8411.83 11.91 58.35 62.04 62.78FC+ESG 12.8911.72 11.82 57.95 62.20 63.71FC 13.3312.93 13.12 57.83 59.49 59.80修剪-FC+重新定义-E/S/G 12.1911.44 12.42 61.14 63.3161.19trimmed-FC+E/S/G 12.2311.41 12.38 61.17 63.35 61.56 Trimmed-FC+ESG 12.2711.36 12.06 61.11 63.29 61.54(b)样本外MAE(左)和CCC(右)条形图为了探索模型在不同日期的表现,我们计算2014年6月至2017年6月期间测试集每个日期的MAE和CCC测量交叉库存。多层感知器的性能指标时间序列如图9所示。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 10:37