楼主: mingdashike22
3932 105

[量化金融] 深入学习资产定价 [推广有奖]

81
可人4 在职认证  发表于 2022-6-14 09:44:23
(1987):“条件矩限制下估计的渐近效率”,《计量经济学杂志》,34(3),305–334。Chamberlain,G.和M.Rothschild(1983):“大型资产市场的套利、因素结构和均值方差分析”,《计量经济学》,51(5),1281–1304。Chen,X.和S.Ludvigson(2009):“吸毒者之地?基于习惯的资产定价模型的实证研究”,《应用计量经济学杂志》,第241057-1093页。Chen,Z.和P.J.Knez(1995):“市场整合和套利的衡量”,《金融研究评论》,8(2),287-325。Cong,L.W.,K.Tang,J.Wang和Y.Zhang(2020):“AlphaPortfolio for Investment and Economic Expressable AI”,工作文件。Fama,E.F.和K.R.French(1992):“预期股票回报的横截面”,《金融杂志》,47(2),427–465。Fama,E.F.和K.R.French(1993):“股票和债券回报中的常见风险因素”,《金融经济学杂志》,33(1),3-56。(2015):“五因素资产定价模型”,《金融经济学杂志》,116(1),1-22。有关数据,请访问https://mpelger.people.stanford.edu/research.Feng、G.、J.He和N.G.Polson(2018):“预测资产回报的深度学习”,工作论文。Feng,G.、N.G.Polson和J.Xu(2019):“特征分类因子模型的深入学习”,工作论文。Freyberger,J.、A.Neuhierl和M.Weber(2020):“非参数分析特征”,《金融研究评论》,即将出版,33(5),2326–2377。古德费罗,I.、Y.本吉奥和A.库维尔(2016):深度学习。麻省理工学院出版社。Goodfello,I.、J.Pouget Abadie、M.Mirza、B.Xu、D.Warde Farley、S.Ozair、A.Courville和Y.Bengio(2014):“生成性对抗网络”,神经信息处理系统进展,第2672–2680页。Gu,S.,B.Kelly和D。

82
mingdashike22 在职认证  发表于 2022-6-14 09:44:27
秀(2019):“自动编码资产定价模型”,《计量经济学杂志》,即将出版。Gu,S.、B.T.Kelly和D.Xiu(2020):“通过机器学习的经验资产定价”,《金融研究评论》,33(5),2223-2273。Guijarro Ordonez,J.、M.Pelger和G.Zanotti(2021):“深度学习统计套利”,工作文件。Hansen,L.P.(1982):“广义矩估计方法的大样本性质”,计量经济学,50(4),1029–1054。Hansen,L.P.和R.Jagannathan(1997):“评估随机贴现因子模型中的规格误差”,《金融杂志》,52(2),557–590。Heaton,J.、N.Polson和J.H.Witte(2017):“金融深度学习:深度投资组合”,《商业和工业应用随机模型》,33(1),3–12。Hochreiter,S.和J.Schmidhuber(1997):“长-短期记忆”,《神经计算》,9(8),1735-1780。Horel,E.和K.Giesecke(2020):“迈向可解释的AI:神经网络的重要测试”,《机器学习研究杂志》,即将出版。Kelly,B.、S.Pruitt和Y.Su(2019):“特征是协方差:风险和回报的统一模型”,《金融经济学杂志》,134(3),501–524。Kingma,D.P.和J.Ba(2014):“Adam:随机优化的方法”,CoRR.Kozak,S.,S.Nagel和S.Santosh(2020):“缩小横截面”,《金融经济学杂志》,135(2),271–292。Lettau,M.和M.Pelger(2020):“符合股票回报时间序列和横截面的因素”,《金融研究评论》,33(5),2274–2325。Lewis,G.和V.Syrgkanis(2018):“对抗性广义矩法”,工作文件。Ludvigson,S.和S.Ng(2007):“经验风险收益关系:因子分析方法”,《金融经济学杂志》,83(1),171-222。(2009):“债券风险溢价中的宏观因素”,《金融研究评论》,22(12),5027–5067。马丁,I.和S。

83
大多数88 在职认证  发表于 2022-6-14 09:44:30
Nagel(2020):“大数据时代的市场效率”,工作文件。McCracken,M.W.和S.Ng(2016):“FRED-MD:宏观经济研究月度数据库”,《商业与经济统计杂志》,34(4),574-589。Messmer,M.(2017):“深度学习和预期回报的横截面”,工作文件。Moritz,B.和T.Zimmerman(2016):“基于树的条件投资组合排序:价格和未来股票回报之间的关系”,工作论文。Nagel,S.和K.J.Singleton(2011):“条件资产定价模型的估计和评估”,《金融杂志》,66(3),873–909。Pelger,M.(2020):“理解系统风险:高频方法”,《金融杂志》,即将出版。Pelger,M.和R.Xiong(2019):“大尺寸的可解释稀疏近似因子”,工作论文。(2021):“大维度的状态变量模型”,《商业与经济统计杂志》,即将出版。Pesaran,H.M.和A.Timmermann(1996):“股票回报的可预测性:稳健性和经济重要性”,《金融杂志》,50(4),1201-1228。Ross,S.A.(1976):“资本资产定价的套利理论”,《经济理论杂志》,13341-360。Rossi,A.G.(2018):“利用机器学习预测股市回报”,工作论文。Ruder,S.(2016):“梯度下降优化算法概述”,CoRR.Sirignano,J.、A.Sadhwani和K.Giesecke(2020):“抵押贷款风险的深入学习”,《金融计量经济学杂志》,即将出版。Srivastava,N.、G.Hinton、A.Krizhevsky、I.Sutskever和R.Salakhutdinov(2014):“辍学:防止神经网络过度匹配的简单方法”,《机器学习研究杂志》,1929-1958年。Wager,S.、S.Wang和P.S.Liang(2013):“作为自适应正则化的辍学训练”,《神经信息处理系统进展》,第26351–359页。I.韦尔奇和A。

84
kedemingshi 在职认证  发表于 2022-6-14 09:44:34
Goyal(2007):“全面审视股票溢价预测的实证表现”,《金融研究评论》,21(4),1455–1508。附录A.估计方法附录A.前馈网络(FFN)深度神经网络考虑L层,如图A.1所示。每个隐藏层生成前一层的输出,并将其转换为输出asx(l)=ReLUW(l-1) >x(l-1) +宽(l-1)= 雷鲁w(l-1) +K(l-1) Xk=1w(长)-1) kx(l-1) k级y=W(L)>x(L)+W(L),隐层输出x(L)=(x(L)。。。,x(l)K(l))∈RK(l)和参数W(l)=(W(l)。。。,w(l)K(l))∈RK(l)×K(l)-1) 对于l=0。。。,L- 1和W(L)∈RK(L)。图A.1。具有3个隐藏层的前馈网络附录B。递归神经网络(RNN)LSTM由一个单元(LSTM单元的存储部分)和三个“调节器”(称为门)组成,它们是LSTM单元内信息流的三个“调节器”:一个输入门、一个遗忘门和一个输出门。直观地说,单元负责跟踪输入序列中元素之间的依赖关系。输入门控制新值流入单元格的程度,忘记门控制值留在单元格中的程度,输出门控制单元格中的值用于计算STM单元的输出激活的程度。我们将xt=It作为宏观经济信息的输入序列,输出为状态过程ht。在每个步骤中,使用当前输入XT和以前的隐藏状态ht创建一个新的存储单元CTI-1ct=tanh(W(c)hht-1+W(c)xxt+W(c))。输入和遗忘门控制存储单元,而输出门控制隐藏状态下存储的信息量:输入=σ(W(i)hht-1+W(i)xxt+W(i))遗忘=σ(W(f)hht-1+W(f)xxt+W(f))outt=σ(W(o)hht-1+W(o)xxt+W(o))。sigmoid函数σ是一种元素非线性变换。

85
大多数88 在职认证  发表于 2022-6-14 09:44:37
用wiseproduct表示元素o, 最终存储单元和隐藏状态由ct=遗忘给出o 计算机断层扫描-1+输入o ct,ht=outto tanh(ct)。我们使用状态过程HTT代替宏观经济变量ITA作为SDF网络的输入。附录C.训练深层神经网络的实施一般的随机梯度下降法不是一种有效的方法。更好的方法是使用引入自适应学习率的优化方法。我们使用基于梯度的随机目标函数优化算法Adam,基于低阶矩的自适应估计来持续调整学习速率。它更容易逃逸鞍点,因此更精确,同时提供更快的收敛速度。正则化非常重要,可以防止模型过度拟合训练样本。虽然l/l规则化也可以用于训练其他神经网络,但退出更可取,通常会产生更好的性能。术语“辍学”是指神经网络中的辍学单元。通过放弃一个单元,我们的意思是暂时将其从网络中删除,以及以一定的概率将其所有传入和传出连接一起删除。辍学可以显示为脊线正则化的一种形式,仅在训练期间应用。在进行样本测试时,我们保留所有单元及其连接。总之,超参数选择工作如下:(1)首先,对于每种可能的超参数组合(384个模型),我们定义GAN模型。(2) 其次,我们在验证数据集上选择四个最佳超参数组合。(3) 第三,对于四种组合中的每一种,我们将9个模型划分为具有相同超参数但不同初始化的模型。(4) 最后,我们在验证数据集上选择性能最好的集成模型。

86
大多数88 在职认证  发表于 2022-6-14 09:44:40
表A.VIII报告了性能最佳模型的调整参数。估计SDF权重的前馈网络有2个隐藏层(HL),每个隐藏层有64个节点(HU)。有四个隐藏状态(SMV)总结了LSTM网络中的宏观经济动态。conditionaladversarial网络在0层(CHL)网络中生成8个矩(CHU)。条件矩的宏观经济动力学总结为32个隐藏状态(CSMV)。这种条件网络本质上对特征和隐藏的宏观经济状态应用非线性变换,然后将它们线性组合。例如,由此产生的时刻可以根据特征信息或仅在特定宏观经济条件下有效的投资组合捕捉长短组合的定价错误。预测的FFN采用顾、凯利和秀(2020)选择的最佳超参数,这是一个三层神经网络,例如Ruder(2016)和Kingma and Ba(2014)。我们使用领先算法Adam。其他自适应梯度下降方法包括Adagrad或Adadelta。关于辍学和赌博的更好表现结果,参见Srivastava、Hinton、Krizhevsky、Sutskever和Salakhutdinov(2014),关于与ridge的联系,参见Wang和Liang(2013)。具有[32,16,8]个隐藏单元的网络,辍学保留概率为0.95,学习率为0.001。我们的GAN网络受到Goodfello等人(2014)提出的机器学习GAN的启发,但实施方式不同,专门针对我们的问题设计。机器学习通常用更深层次的神经网络和同步优化来实现,即每个网络只做一些优化步骤,而没有完成优化,然后再与另一个网络进行迭代。

87
何人来此 在职认证  发表于 2022-6-14 09:44:43
这通常是必要的,因为机器学习GANs被应用于hugedata集,在那里,要完全解决每个优化问题,计算成本太高。相反,我们运行每个优化步骤直到收敛。对于我们的基准模型,这意味着在第一步中,我们将找到一个SDF,对所有10000只股票进行定价,而不使用工具。然后,我们完全解决了对抗性问题,生成了一个8维的仪器向量。在第三步中,我们完全估计了可为所有80000个工具化股票回报定价的SDF。结果表明,该程序非常稳定,在我们的实证分析的前三个步骤后已经收敛,如图IA所示。1在互联网附录中。相比之下,传统的机器学习GAN通常会为计算原因创建较小的对抗性数据集,这也会导致更多的迭代以耗尽信息集。附录B.模拟示例我们通过模拟说明:(1)GAN中的无套利条件对于在低信噪比设置中找到DF是必要的,(2)GAN的灵活形式对于正确捕获特征之间的相互作用是必要的,以及(3)RNN和LSTM对于将宏观经济动态正确纳入定价核心是必要的。为此,我们设计了尽可能简单的模拟装置来表达这些观点,并表明预测方法或简单的线性模型公式无法实现这些目标。超额收益遵循无套利模型Ret+1,i=βt,iFt+1+在我们的简单模型中,DF遵循Fti。i、 d。~ N(uF,σF)和特质成分t、 二。i、 d。~ N(0,σe)。我们考虑两种不同的风险负荷公式:1。两个特征:载荷是两个特征βt的乘法相互作用,i=C(1)t,i·C(2)t,i与C(1)t,i,C(2)t,ii。i、 d。~ N(0,1)。2.

88
kedemingshi 在职认证  发表于 2022-6-14 09:44:46
一个特征和一个宏观经济状态过程:负载取决于一个字符我们在两个GPU群集上估计了我们的模型,其中每个群集有两个Intel Xeon E5-2698 v3 CPU、1TB内存和8个Nvidia Titan V GPU。我们将TensorFlow与Python 3.6一起用于模型拟合。用超参数调谐完成GAN模型的估计大约需要3天。我们已经证实,我们的估计结果对于使用更大的超参数空间是稳健的。即使在我们的快速GPU集群上,在更大的超参数空间上进行完整的超参数搜索也可能需要数周或数月的时间,因此我们有选择地测试了更多的超参数。我们对各种不同的模型公式进行了大量模拟,得出了相同的结论。其他模拟结果可根据要求提供。特征和循环状态过程ht:βt,i=Ct,i·b(ht),ht=sin(π* 电话/24)+ht,b(h)=(如果h>0,则为1-1否则。我们只观察到趋势Zt=uMt+ht的宏观经济时间序列。所有创新都是独立且正态分布的:Ct,ii。i、 d。~ N(0,1)和hti。i、 d。~ N(0,0.25)。参数的选择以我们的经验结果为指导,并在表A.I中进行了总结。面板数据集为N=500,T=600,其中第一个Ttrain=250用于培训,下一个ttvalid=100个观察值是验证,最后一个ttset=250个观察值构成测试数据集。具有两个特征的第一个模型具有两个显著的经验特征:(1)荷载对这两个特征具有非线性相互作用效应;(2) 对于许多资产来说,信号噪声比很低。由于乘法形式,当两个值接近零的特性相乘时,载荷将取较小的值。图A.2显示了人口负荷的形式。

89
能者818 在职认证  发表于 2022-6-14 09:44:48
中心负载的资产主要由特质(idiosynctionoise)驱动,这使得提取其系统组件变得更加困难。表A.I报告了第一个模型的结果。GAN模型在所有类别中都优于forecastingapproach和线性模型。注意,没有必要包括弹性净方法,因为协变量的数量只有两个,因此正则化没有任何帮助。估计的GAN SDF的Sharpe比率达到与生成数据的人口SDFused相同的值。根据估计的负荷量和总体负荷量,我们投影出特质分量,以获得解释的变化和横截面定价误差。正如预期的那样,该设置的线性模型规格错误,既没有捕获DF,也没有捕获正确的加载结构。注意,简单的预测方法可以产生较高的夏普比率,但无法解释系统成分。图A.2解释了我们观察上述性能结果的原因。注意,SDF在特征的极端角点组合上具有较大的正权重和负权重。中间的组合接近于零。GAN网络捕获该模式,并在高/高和低/低的组合上分配正权重,在高/低和低/高的组合上分配负权重。另一方面,FFN生成的图片更具差异性。它为低/低组合指定负权重。FFN SDF仍主要集中在极端投资组合上,这些投资组合的夏普比率较高。然而,FFN未能正确捕获装载量,这导致了大量无法解释的变化和定价错误。线性模型显然不能捕捉非线性相互作用。第二个带有宏观经济状态变量的模型设置旨在模拟aboom和衰退周期对定价模型的影响。

90
大多数88 在职认证  发表于 2022-6-14 09:44:53
在我们的模型中,SDF在繁荣和衰退周期中对资产产生不同的影响。请注意,在我们的示例中,宏观经济变量canby construction仅对SDF因子的荷载具有缩放效应,但不会改变其横截面分布,而横截面分布仅取决于具体信息。图A.3说明了观察到的宏观经济变量的路径,该变量具有可区分的表A.I:两个模拟设置中不同SDF模型的性能夏比EV横截面RModel Train有效测试Train有效测试Train有效测试Train两个特征和无宏观经济状态变量总体0.96 1.09 0.94 0.16 0.15 0.17 0.17 0.15 0.17GAN 0.98 1.11 0.94 0.12 0.11 0.130.10 0.09 0.07FFN 0.94 1.04 0.89 0.05 0.04 0.05-0.30-0.09-0.33LS 0.07-0.10 0.01 0.00 0.00 0.00 0.00 0.01 0.01一个特征和一个宏观经济状态变量人口0.89 0.92 0.86 0.18 0.18 0.17 0.19 0.20 0.15GAN 0.79 0.77 0.64 0.18 0.17 0.19 0.20 0.15 FFN 0.05-0.06 0.02 0.01 0.02 0.01 0.01 0.02LS 0.12-0.05 0.10 0.16 0.16 0.15 0.15 0.18 0.14此表报告了夏普SDF的比率(SR),解释了GAN、FFN和LS模型的时间序列变化(EV)和横截面平均值。由于只有很少的协变量,因此在这种设置中不考虑EN。数据由Sharpe比率SR=1和σF=0.1的SDF生成,特殊噪声σe=1。宏观经济时间序列的趋势uM=0.05。观测次数为N=500,T=600,Ttrain=250,Tvalid=100,Ttest=250。我们在数据集中观察到的大多数宏观经济变量的ing特征:(1)宏观经济过程是非平稳的,即有趋势;(2) 该流程具有周期性动态结构,即受商业周期的影响。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 21:08