楼主: mingdashike22
3843 105

[量化金融] 深入学习资产定价 [推广有奖]

31
nandehutu2022 在职认证  发表于 2022-6-14 09:41:42
直观地说,LSTM使用不同的TRNN结构来建模短期和长期依赖关系,并将其与非线性函数相结合。我们可以将LSTM视为大维系统的灵活隐藏状态空间模型。一方面,它提供了一个类似于latentfactor模型的横截面聚合。另一方面,它提取了与状态空间模型在精神上相似的动力学,例如通过卡尔曼滤波器估计的简单线性高斯状态空间模型。LSTM的优势在于它将这两个元素结合在一个一般的非线性模型中。在B部分的模拟示例中,我们说明了LSTM可以成功地提取商业周期模式,该模式从本质上捕获本地平均值与长期平均值的偏差。同样,我们实证分析中的状态过程似乎也基于宏观经济增量的短期和长期平均值之间的关系,因此代表了一种商业周期类型的行为。LSTM的输出是少量的状态过程ht=hLSTM(x,…,xt),我们使用这些状态过程代替宏观经济变量作为SDF网络的输入。请注意,每个州的HTH仅取决于当前和过去的宏观经济增量,没有前瞻性偏差。D、 生成对抗网络(GAN)调节函数g是第二个前馈网络的输出。受生成性对抗网络(GAN)的启发,我们选择了两个网络相互竞争,从而导致最大PricingDiscreency的时刻条件。一个网络创建SDFMt+1,另一个网络创建调节功能。我们采取三个步骤来训练模型。我们的第一步SDF将无条件最小化。其次,给定此SDF,我们通过优化条件网络中的参数来最大化损失。

32
何人来此 在职认证  发表于 2022-6-14 09:41:45
最后,在给定条件网络的情况下,我们对SDF网络进行更新,以最小化条件损失。这个想法背后的逻辑是,通过最小化所有可能条件函数的最大条件损失,任何函数的损失都很小。请注意,DF网络和条件网络均使用FFN网络与LSTM相结合,以估计宏观经济隐藏状态变量,即,不是直接使用ITA,而是使用输入每个网络汇总状态过程ht中的整个宏观经济时间序列信息(分别为条件网络的HGTF)。这两个LSTM基于两个网络的标准函数,即HTM是可以最小化定价错误的隐藏状态,而hgt生成错误定价最大的测试资产:{ω,^ht,^g,^hgt}=minω,htmaxg,hgtL(ω| g,hgt,ht,It,i)。E、 超参数与集成学习由于问题的高维性和非线性,训练深层神经网络是一项复杂的任务。在这里,我们总结了实施情况,并在附录A.C.中提供了更多细节。我们通过使用“退出”来防止模型过度拟合,并处理大量参数,这是一种正则化形式,通常比传统l/l正则化具有更好的性能。我们通过采用基于梯度的自适应学习率来精确高效地优化目标函数。我们通过对多个模型的集合平均来获得稳健和稳定的结果。神经网络的一个显著特点是,估计结果可以依赖于优化中使用的起始值。Gu、Kelly和Shui(2020)也采用的标准实践是,使用从最优分布中选择的不同初始值分别训练模型。

33
大多数88 在职认证  发表于 2022-6-14 09:41:49
对多个函数进行平均可以实现两个目标:第一,它可以减少局部次优函数的影响。第二,它可以减少估计模型的估计方差。我们所有的神经网络(包括预测方法)都在九个模型上取平均值。让^w(j)和^β(j)分别是jthmodel fit给出的SDF载荷的最优投资组合权重。插入模型是具有相同架构但优化起始值不同的模型输出的平均值,即ω=Pj=1ω(j)和β=Pj=1β(j)。请注意,对于向量值函数,例如调节函数g和宏观经济状态h,报告其模型平均值没有意义,因为向量中的不同条目不一定会反映每个函数中的相同对象。我们将数据分割为训练、验证和测试样本。验证集用于调整超参数,其中包括网络的深度(层数),传统的GAN网络会迭代此过程直到收敛。我们发现,我们的算法在上述三个步骤后收敛,即模型不会通过重复对抗性博弈而进一步改进。用于实证分析的GAN迭代的详细结果如图IA所示。1在互联网附录中。我们考虑到SDF和条件网络的潜在不同宏观经济状态,因为识别SDF的无条件矩条件可以取决于不同于SDF权重的状态。超过九个模型的集合产生非常稳健和稳定的结果,并且不会对超过多个模型的平均值产生影响。结果可根据要求提供。每层(节点)的基函数数、宏观经济状态数、调节工具数和调节网络结构。

34
能者818 在职认证  发表于 2022-6-14 09:41:52
我们通过最大化SDF对验证数据的夏普比率,在所有可能的超参数组合中选择最佳配置。根据试验数据对优化模型进行了评价。我们的优化模型有两层,四个经济状态和八个测试资产工具。我们的结果对第III.H节中讨论的调整参数具有鲁棒性。特别是,我们的结果不依赖于网络的结构,验证数据上表现最好的网络提供了基本相同的模型,在测试数据上具有相同的相对性能。预测方法的FFN使用Gu、Kelly和Xiu(2020)选择的最优超参数。这样做的另一个好处是,我们的结果可以与他们的结果直接进行比较。F、 模型比较我们通过计算SDF的夏普比率、解释变化量和定价误差来评估我们模型的性能。我们将我们的GAN模型与其线性特例(一个线性因子模型)和深度学习预测方法进行了比较。单因素表示法产生了三个性能指标来比较不同的模型公式。首先,SDF是在全球效率前沿构建的,应具有最高的条件夏普比率。我们使用SDF投资组合的无条件夏普比率SR=E[F]√V ar【F】作为评估模型定价性能的一种度量。第二个指标衡量SDF解释的变量。解释的变化定义为1-PNi=1E[i] PNi=1E【Rei】,其中II荷载横截面回归的剩余值。正如Kelly、Pruitt和Su(2019)所述,由于平均值估计中的非平稳性和噪声,我们不会降低回报率。我们的解释变异度量可以解释为时间序列R。

35
何人来此 在职认证  发表于 2022-6-14 09:41:55
第三个绩效衡量指标是平均收益归一化的平均定价误差,以获得横截面RME衡量1-NPNi=1E[i] NPNi=1E【Ri】。我们的GAN模型的输出是SDF因子权重^ωGAN。我们通过建立前馈网络来预测Ret+1Ft+1,从而估计Et【Ret+1Ft+1】,从而获得风险敞口^βGan。请注意,该负荷估计值^βGANis仅与总体值β成比例,但这对于预测系统和非系统组件是有效的。我们称之为FFN的传统预测方法产生的条件平均值^uF N与β成正比,因此在投影中用作^βF nni。同时,μF与SDF因子组合权重成正比,因此也可作为μωF N。因此,GAN和FFN之间的根本区别在于GAN估计条件二阶矩βGAN=Et【Ret+1Ft+1】,而FFN则估计横截面定价的条件一阶矩βF N=Et【Ret+1】。我们使用了不同的标准函数,包括最小化力矩条件的误差,来选择超参数。结果几乎相同,可根据要求提供。请注意,标记为LS的线性模型是具有显式解^θLS的特例=TTXt=1NNXi=1Ret+1,iIt,i!NNXi=1Ret+1,iIt,i!>-1NTTXt=1NXi=1ET+1,iIt,i=TTXt=1英尺+1英尺>t+1!-1TXT=1F>t+1!SDF因子投资组合权重ωLS=^θ>LSIt,i.风险敞口^βLSI是通过Ret+1Ft+1的线性回归得到的,i.由于我们的设置中特征的数量非常多,线性模型可能会受到过度拟合的影响。非线性模型包括一种正则化形式,用于处理大量特征。为了使模型比较有效,我们还对线性模型添加了正则化。

36
能者818 在职认证  发表于 2022-6-14 09:41:58
正则化线性模型EN向回归中添加弹性网惩罚,以获得^θENand,并对^βEN进行预测回归:^θEN=arg minθTTXt=1Ft+1-TTXt=1英尺+1英尺>t+1θ!+λkθk+λkθk。弹性网的线性方法与Kozak、Nagel和Santosh(2020)密切相关,他们对基于特征的因子进行弹性网惩罚的均值-方差优化。此外,我们还报告了基于AMA-French 3和5因子模型的相切投资组合的最大夏普比率。对于四个模型GAN、FFN、EN和LS,我们获得了用于构造SDFan的ω的估计和用于计算残差的β的估计. 我们通过预测估计风险敞口^β:^的回报来获得系统和非系统回报成分t+1=在中-^βt(^β>t^βt)-1^β>tRet+1。对于每个模型,我们报告(1)SDF因子的无条件夏普比,(2)解释弹性网包括套索和脊正则化作为特例。根据验证数据,我们对弹性网络的调谐参数进行了优化选择。他们的论文有五个不同之处。首先,他们使用基于贝叶斯先验的修正岭惩罚。其次,它们还包括产品术语的特征。第三,他们的二阶矩矩阵使用demeanedreturns,即这两种方法在全球有效前沿选择不同的均值方差有效投资组合。第四,我们考虑了基于特征的因素的长短腿上的不同线性权重。第五,他们建议在用弹性净惩罚解决均值-方差优化之前,首先对特征管理因子应用PCA。Lettau和Pelger(2020)将鲁棒SDF恢复推广到RP-PCA空间。Bryzgalova、Pelger和Zhu(2020)也在稳健SDF恢复中加入了额外的平均收缩率,并提出决策树作为PCA的替代方法。

37
大多数88 在职认证  发表于 2022-6-14 09:42:01
Bryzgalova、Pelger和Zhu(2020)也表明,具有正则化的均值-方差优化可以解释为具有参数不确定性的对抗性方法。我们使用传统的长短因子作为基准,因为它们是文献中最常用的线性模型。基于PCA的方法推迟到第III.J节。相切投资组合权重在训练数据集上获得,并用于验证和测试数据集。个体股票收益率的变化和(3)横截面平均值:SR=^E[Ft]qdV ar(Ft),EV=1-TPTt=1 NTPNTI=1(^)t+1,i)TPTt=1NtPNti=1(Ret+1,i), XS-R=1-NPNi=1TiTTiPt公司∈Ti^t+1,iNPNi=1TiTTiPt公司∈Ti^Rt+1,i.这些是线性资产定价中使用的标准度量的概括。我们还对传统的特征分类投资组合评估了我们的模型。portfolioloadings是由投资组合权重加权的股票负载的平均值。更详细地说,我们的模型为每个单独的股票i提供了风险负荷βt,i。投资组合的风险负荷βt是通过聚合相应的股票特定负荷获得的。我们从每个时间点的投资组合βt的投资组合回报的横截面回归中获得投资组合误差。这类似于线性模型中的标准横截面Fama-MacBeth回归,主要区别在于βt是从我们的SDF模型中获得的。投资组合的EV和XS RFR指标遵循与单个股票相同的程序,但使用投资组合代替股票回报。

38
可人4 在职认证  发表于 2022-6-14 09:42:04
对于单个分位数,我们还报告了由所有相应分位数排序投资组合的均方根平均收益未归一化的定价误差^α,即^αi=^E[^t、 i]qNPNi=1^E[Rt,i]。附录B包括一个模拟,说明所有三个评估指标(SR、EV和XS-R)都是评估SDF质量所必需的。像FFN这样的模型可以通过加载一些极端的投资组合来实现高清晰度,但这并不意味着它能够正确地捕获加载结构。类似地,线性因子可以实现高夏普比,但通过构造无法捕捉SDF载荷中的非线性和相互作用效应,这反映在lowerEV和XS-R中。无论模型的灵活性如何(例如FFN),仅通过调节最近的宏观经济观察,一般宏观经济动态被排除,这似乎是夏普比率中反映最强烈的。GAN模型中的无套利条件有助于处理低信噪比,并正确估计风险溢价较小的股票的SDFloadings,这反映在XS-R.III《美国股票a的实证结果》中。数据我们收集CRSP上所有证券的月度股权回报数据。样本期为1967年1月至2016年12月,共50年。

39
何人来此 在职认证  发表于 2022-6-14 09:42:07
我们将全部数据分为20年的训练样本(1967-1986)、5年的验证样本(1987-1991)和25年的样本外。我们通过其收敛速度对估计的平均值进行加权,以解释精度上的差异。注意,XS-R=1-PNi=1^αi.Pelger和Xiong(2019)提供了理论论点,并在线性设置中以经验证明了为什么仅正确捕获极端因子权重的“近似”因子与人口因子具有类似的时间序列特性,但其投资组合权重不是正确的载荷。测试样本(1992-2016)。我们使用KennethFrenchdata库中的一个月国库券利率作为无风险利率来计算超额收益。此外,我们收集了Kenneth French DataLibrary上列出的46个企业特定特征,或Freyberger、Neuhierl和Weber(2020)使用的特征。所有这些变量都是根据CRSP/Compustat数据库中的会计变量或CRSP过去的返回数据构建的。我们在变量定义、构造及其更新方面遵循标准惯例。每年更新的变量在Fama Frenchconvention之后的每年6月底更新,而每月变化的变量在每个月底更新,以便在下个月使用。有关这些变量构造的完整详细信息,请参见互联网附录。在表A.II中,我们将特征分为六类:过去收益、投资、可盈利性、无形资产、价值和交易摩擦。CRSP的所有可用库存数量约为31000支。正如Kelly、Pruitt和Su(2019年)或Freyberger、Neuhierl和Weber(2020年)所述,我们仅限于在某个月内拥有所有公司特征信息的股票回报,这使得我们拥有约10000只股票。

40
大多数88 在职认证  发表于 2022-6-14 09:42:10
这是可用于此类分析的最大数据集。对于每个月的每个特征变量,我们将其横截面排序,并将其转换为分位数。这是处理不同规模的标准转换,Kelly、Pruitt和Su(2019)、Kozak、Nagel和Santosh(2020)或Freyberger、Neuhierl和Weber(2020)等也采用了这一转换。在线性模型中,预测▄Ft+1=NPNi=1It,iRet+1,ire导致长-短因子,特征值高于中值的股票的正权重增加,而低于中值的股票的负权重减少。我们通过分别包括每个特征的正支腿和负支腿来增加线性模型的灵活性,即我们取特征值中位数以上的股票的秩加权平均值,中位数以下的股票的秩加权平均值。这将导致每个特性有两个“因素”。请注意,我们的模型将传统的长短因子作为特殊情况包括在内,其中长短腿在SDF中接受相同的相对符号绝对权重。这些因素仍然是零成本投资组合,因为它们基于超额回报。我们使用Freyberger、Neuhierl和Weber(2020)在2017年版论文中使用的特征。使用缺少特征信息的股票需要基于模型假设进行数据插补。Gu、Kelly和Xiu(2019)用当月该特征的横截面中值替换缺失的特征。然而,这种方法引入了额外的误差源,并忽略了特征空间中的依赖结构,从而在特征中创建了我们想要避免的艺术时间序列。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 14:12