楼主: mingdashike22
1431 34

[量化金融] 量化机构:金融时间序列的深层次生成 [推广有奖]

21
大多数88 在职认证  发表于 2022-6-24 09:38:52
我们以一维情形(NX=1)为例,其中新息NP被训练为表示标准正态分布随机变量t、 θ~ N(0,1)表示所有t∈ Z在这种情况下,可以简化风险中性动态,因为可以明确计算条件期望h(σt,θ,ut,θ):h(σt,θ,ut,θ)=E[经验值(σt、 θ+u|{z}~ N(u,σ))]σ=σt,θu=ut,θ=exput,θ+σt,θ!。因此,风险中性对数收益NP由Mt给出,θ=σt,θt、 θ-σt,θ+rand贴现风险中性价格过程完成了▄SMt,θ=▄SMt的递归-1,θexpσt,θt、 θ-σt,θ!。特别是,求解该递归给出了显式表示▄SMt,θ=SexptXs=1σs,θs、 θ-σs,θ!!SMt,θ=六角txs=1“σs,θs、 θ-σs,θ#+rt!。备注5.8(与Black-Scholes模型的比较)。在一维Black-Scholes模型中,价格过程的风险中性分布由Q给出,BSt=Sexpr-σt+σWQt= SexpσWQt-σt+rt.重要的是,与布莱克-斯科尔斯(Black-Scholes)相比,本文提出的模型并没有假设恒常性,而是使用波动率生成器对其进行建模。同样,波动率NP可以约束为表示一个已知的随机过程,如CIR过程或GARCH(p,q)模型的方差过程。这两种设置都允许我们深入了解手头随机过程的潜在动力学,从而验证建模假设。6预处理0:T∈ RNX×(T+1)所采取的每个步骤。请注意,所有使用的变换(不包括滚动窗口)都是可逆的,并且thu允许通过反转步骤1-4对从日志返回NP中采样的序列进行后处理,以获得所需的形式。

22
何人来此 在职认证  发表于 2022-6-24 09:38:56
此外,请注意,管道包括前面在第5.3小节中讨论的反向Lambert变换。TimeSeries0:TStep 1:Log Returnsr1:TStep 2:NormalizeStep 3:InverseLambert WTransformStep 4:NormalizeStep 5:RollingWindowCast TopytorchPreprocessedSeries图9:预处理管道的精简表示。步骤1:日志返回r1:t计算日志返回序列rt=Logstst公司-1.对于所有t∈ {1,…,T}。第2步和第4步:标准化出于数值原因,我们对数据进行标准化,以获得一个均值和单位方差为零的序列,这在LeCun等人(1998)中得到了彻底的推导。-6.-4.-2 0 2 4 600.10.20.30.40.50.60.70.8标准化日志返回高斯分布式AMBERTWx个高斯对数返回密度(a)标准化日志返回-6.-4.-2 0 2 4 600.10.20.30.40.50.60.70.8兰伯特Wx个日志ReturnsGaussianLog返回密度(b)Lambert W x Log returns图10:(a)原始标准普尔500对数返回和aLambert W x Gaussian随机变量的固定概率密度函数。(b) 逆Lambert W变换对数返回和高斯随机变量的概率密度函数。步骤3:反向Lambert W Transform显示标准普尔500指数原木收益的标准化原始分布,以及无法生成原始分布重尾的反向Lambert Wissue。步骤5:滚动窗口当考虑一个具有可接受字段大小(d)的鉴别器时,我们将相应长度的滚动窗口和跨距1应用于预处理的日志返回序列器(ρ)t。因此∈ {1,…,T- T(d)}我们定义了子序列sr(T)1:T(d):=r(ρ)T:(T(d)+T-1)∈ RNZ×T(d)。备注6.1。请注意,滑动滚动窗口会引入偏差,因为在训练Quant GAN时,时间序列开始和结束时的日志返回是欠采样的。

23
大多数88 在职认证  发表于 2022-6-24 09:38:59
当从训练集中对批次进行采样时,可以使用(非均匀)加权采样方案来纠正这种偏差。7数值结果在本节中,我们通过模拟标准普尔500指数的对数收益来测试量化QAN的生成能力。为了进行比较,我们将著名的GARCH(1,1)模型应用于相同的数据。我们的数值结果表明,量子GANs可以学习一个与经验分布和依赖特性相匹配的神经过程,这远远好于所提出的GARCH模型。7.1设置和实现使用编程语言python编写实现。NN架构是通过使用python包pytorch(Paszke et al.,2017,2019)来实现的,这是一个自动微分库,主要用于NN计算和优化。通过使用pytorch的CUDA后端和支持CUDA的图形处理单元(GPU),THNNS的训练时间缩短了。我们使用NVIDIA的GPU RTX 2070来训练大型模型。在预处理和评估期间,我们使用了numpy和scipy-Jones等人(2001)的软件包。是(Bai等人,2018年,第3节)中提出的架构的扩展,通过使用跳过连接(参见van den Oord等人(2016年),定义3.15)。附录B中给出了该体系结构的详细描述。在发生器和鉴别器的培训过程中,我们应用了Mescheder等人(2018)提出的GAN稳定算法。7.2模型SPURE TCN模型,一种受约束的对数返回NP模型,用于比较一个简单的GARCH模型。与文献中的其他方法相比,提出的模型基于TCN而不是STM。

24
何人来此 在职认证  发表于 2022-6-24 09:39:03
请注意,这主要是由卷积体系结构的优异性能推动的。此处不考虑基于LSTM的模型,将此作为未来的工作。纯TCN为了评估纯TCN模型的能力,我们直接使用接收字段大小为T(g)=127的TCN作为生成函数,即返回过程由T给出,θ=gθ(Zt-(T(g)-1) :t)对于Ztiid之前的三维噪声~ N(0,I),(NZ=3)。受限对数返回NP假设受限对数返回NP(见定义5.1和第5.5节)Rt,θ=σt,θt、 θ+ut,θ与波动率NPσt,θ,漂移NPut,θ和创新NPt、 θ被限制为i.i.d.N(0,1)分布。这里的潜在过程也是i.i.d.Gaussian noiseZtiid~ N(0,I)对于nz=3。创新过程采用以下形式t、 θ=Zt,1对于任何t∈ Z、 具有常数漂移的GARCH(1,1)假设一个具有常数漂移的GARCH(1,1)模型,其中rt,θ=ξt+uξt=σttσt=ω+αξt-1+βσt-1.tiid~ N(0,1)注意,使用pytorch包可以等效地完成Lambert W变换相关参数的预处理和近似。对于u∈ R、 ω>0,α,β∈ [0,1]使得α+β<1,参数向量θ=(ω,α,β,u)。有关GARCH过程的更多详细信息,请参见Bollerslev(1986)。7.3评估路径模拟器:指标和分数为了比较三种不同模型与标准普尔500指数的动态,我们建议使用以下指标和分数。7.3.1分布度量土方工程距离(Distributional Metrics Earth mover DistanceLetph)表示历史和生成的(可能滞后的)日志返回分布。土方工程距离(或Wasserstein-1距离)由EMD确定Ph,Pg= infπ∈∏(Ph,Pg)E(X,Y)~π[| | X- Y | |],其中∏(Ph,Pg)表示所有联合概率分布的集合,边际概率(marginalshandpg)。将Phinto转换为Pg。

25
大多数88 在职认证  发表于 2022-6-24 09:39:07
有关更多详细信息,请参见Villani(2008)。DY度量另外,我们计算agulescu和Yakovenko博士(2002)提出的DY度量。DY度量用于t∈ 定义单位:DY(t)=Xx对数Pht(At,x)- 对数Pgt(At,x),其中,phtandpgtdenote历史和生成的t(At,x)x固定t和所有x的经验概率密度函数,我们(大约)拥有log Pht(At,x)=5/t的历史日志返回数。在评估过程中,我们考虑时间滞后∈ {1、5、20、100},表示每日、每周、每月和100天日志返回的比较。7.3.2相关性得分ACF得分建议使用ACF得分来比较生成的长度为T的日志返回路径的历史和r1:T{r(1)1:▄T,θ,…,r(M)1:▄T,θ}集的相关性属性∈ N、 自相关被定义为时间滞后τ和一系列的函数R1:Tand测量滞后时间序列与系列自我(τ;r)=Corr(rt+τ,rt)的相关性。C:RT→ [-1,1]S:r1:T7→ (C(1;r),C(S;r))滞后S≤ T- 1,计算函数f:R的ACF(f)得分→ R asACF(f):=C(f(r1:T))-MMXi=1Cfr(i)1:T,θ,其中,函数F将元素应用于序列。计算函数f(x)=x、f(x)=x和f(x)=x以及常数S=250、M=500、T=4000的CFScore。杠杆效应分数与现金流量分数类似,杠杆效应分数提供了历史和生成的时间依赖性的比较。杠杆效应是使用滞后的平方对数收益和对数收益本身的相关性来衡量的,即我们认为l(τ;r)=Corrrt+τ,rt对于滞后τ。

26
大多数88 在职认证  发表于 2022-6-24 09:39:12
表示byL:RT→ [-1,1]S:r1:T7→ (L(1;r)。。。,L(S;r))达到滞后S的杠杆效应函数≤ T- 1、杠杆效应得分由L(r1:T)-MMXi=1Lr(i)1:~T,θ.在基准中,杠杆效应得分计算为S=250、M=500和T=4000;与ACF分数相同。7.4生成标准普尔500指数我们考虑2009年5月至2018年12月标准普尔500指数的每日现货价格。正如预期的那样,theGAN训练非常不规则,不能收敛到目标函数的局部最优值。相反,对于每个GAN模型,保存多个学习参数集,并根据第7.3小节中描述的评估指标选择最佳设置。对于每种型号,我们只提供性能最佳的设置结果。在附录中,我们展示了:–每日、每周、每月和100天的实际和生成的对数回报柱状图,–经验置信区间,–作为杠杆效应代理的经验置信区间,–5加上另外50个示例生成的对数路径。此外,表2给出了每个模型的评估指标值。观测ADF统计p值和p 500的时间序列时间跨度2009年5月至2018年12月2413-10.87 1.36×10-19表1:考虑的财务时间序列。我们通过将扩充Dickey-Fuller检验(Mushtaq,2011)应用于时间1.36×10来验证假设1-19序列是静止的。

27
nandehutu2022 在职认证  发表于 2022-6-24 09:39:15
正如预期的那样,Lambert W转换显著帮助报告的模型捕获资产回报的程式化事实;特别是在建模分布的尾部时。7.4.1纯TCN显示的图形表明,TCN模型能够精确建模真实标准普尔中存在的分布和依赖特性。如图A.3所示,生成的对数回报与每个时间尺度上的真实回报直方图非常匹配。即使是100天的滞后回报,其收益率也相当不错。ACF和杠杆效应图也是如此,它们处理数据中固有的依赖结构(见图A.4)。TCN准确地模拟了序列收益的ACF急剧下降,以及小时间滞后的平方和绝对对数非平方对数收益的缓慢衰减ACF。比实际回报的ACF平滑得多。此外,图A.1和图A.2所示的示例性日志路径展示了合理的模式,并展示了TCN模型中可能存在的结构多样性。除表2中评估的两个指标外,TCN的表现最好。特别是,TCN ClearlyOut在每个指标中执行GARCH(1,1)模型,通常通过因子2-10.7.4.2约束SVNN。C-SVNN的性能与TCN相当,但在大多数评估指标中稍差。这是可以预期的,因为与纯TCN相比,由于限制,C-SVNN的自由度更少。如图所示,C-SVNN能够捕获与TCN相同的属性(见图A.7和图A.8)。TCN仅能更好地建模平方和绝对对数回报的ACF。尽管有这些限制,表2中C-SVNN的评估指标几乎与TCN的结果一样好。

28
大多数88 在职认证  发表于 2022-6-24 09:39:19
此外,C-SVNN也显著优于GARCH(1,1)模型。进一步回顾SVNN的结构优势,即波动率可以直接建模,并且其鞅分布的转换是已知的。7.4.3具有常数漂移的GARCH(1,1)GARCH模型在建模分布和依赖特性方面明显优于之前考虑的两种GAN方法。正如资产回报的程式化事实(见第2节)所示,GARCH模型的假设正态分布在对数回报分布的峰值和尾部的概率质量太小,如图A.11中的直方图所示。GARCH结构旨在捕捉这种依赖性。ACFand C-SVNN模型的主要特点。进一步注意,根本没有捕捉到杠杆效应。表2支持这种图形评估,因为GARCH模型在每个评估指标中表现最差。就ACF得分而言,GARCH模型与其他模型具有相当的可比性,正如通过查看图表所指出的那样。相反,在EMD和DY度量模型方面。(1,1)EMD(1)0.0039 0.0.0.0.0.0.0.0.0)5)5)0.0039 0.0 0.0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 0 0.0 0 0 0 0.0 0 0 0 0.0 0 0 0 0 0.0 0 0 0 0 0 0 0 0.0 0 0 0.454(20)0(20(20)0(20)0(20)0(20)0(20)0(20)0(20)0(20)0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0(·))0.0214 0.0245 0.0253杠杆效应0.3291 0.3351 0.4636表2:评估了三个应用模型的指标。

29
nandehutu2022 在职认证  发表于 2022-6-24 09:39:23
对于每行,最佳值以粗体打印。8结论和未来工作在本文中,我们表明,最近开发的神经网络体系结构可以用于众所周知的难以训练的对抗,GANs的进展表明,它们可以提供竞争性结果,并且随着GAN训练程序的发展,未来有望获得更好的性能。对于量化机构来说,未来有两个基本挑战需要解决。第一种是通过结合先验知识(如估计的尾部指数)对生成的尾部进行精确建模和外推。第二,需要开发一个单一的指标,该指标将分布指标与本文中使用的依赖分数相结合,并允许对不同的生成器架构进行基准测试。一旦充分研究和解决了这些问题,QuantGANs提供了一种数据驱动的方法,其性能超过了数学金融中其他传统模型的性能。ReferencesMart'n Arjovsky和L'eon Bottou。培养生成性对抗网络的原则性方法。2017年4月24日至26日在法国土伦举行的第五届国际学习代表大会(ICLR 2017),会议记录,2017年。统一资源定位地址https://openreview.net/forum?id=Hk4_qw5xe.ShaojieBai、J.Zico Kolter和Vladlen Koltun。序列建模通用卷积和递归网络的经验评估。更正,abs/1803.012712018。统一资源定位地址http://arxiv.org/abs/1803.01271.Fischer布莱克和迈伦·斯科尔斯。期权和公司负债的定价。政治经济学杂志,https://EconPapers.repec.org/RePEc:ucp:jpolec:v:81:y:1973:i:3:p:637-提姆·博勒斯列夫。广义自回归条件异方差。《计量经济学杂志》,31(3):307-3271986。统一资源定位地址https://EconPapers.repec.org/RePEc:eee:econom:v:31:y:1986:i:3:p:307-Hans Buehler和Evgeny Ryskin。

30
大多数88 在职认证  发表于 2022-6-24 09:39:27
大时间步长的离散局部波动率(扩展版)。2017年,电话:2642630。Hans Buehler、Lukas Gonon、Josef Teichman和Ben Wood。深度对冲。《定量金融》,第1–21页,2019a年2月。内政部:10.1080/14697688.2019.1571683。Hans Buehler、Lukas Gonon、Ben Wood、Josef Teichman、Baranidharan Mohan和Jonathan Kochems。深度版本。SSRN提供,2019b。Anirban Chakraborti、Ioane Muni Toke、Marco Patriarca和Fr'ed'eric Abergel。经济物理学评论:I.经验事实。《定量金融》,11(7):991–10122011。内政部:10.1080/14697688.2010.539248。统一资源定位地址htps://doi.org/10.1080/14697688.2010.539248.JunyoungChung、C,aglar G,ulc,ehre、KyungHyun Cho和Yoshua Bengio。经验评估gatedhttp://arxiv.org/abs/1412.3555.Djork-Arne Clevert、Thomas Unterthiner和Sepp Hochreiter。利用指数线性单元(ELU)进行快速准确的深度网络学习。2016年5月2日至4日在波多黎各圣胡安举行的第四届国际学习代表大会(ICLR 2016),会议记录,2016年。统一资源定位地址http://arxiv.org/abs/1511.07289.Rama续:资产回报的经验性质:程式化事实和统计问题。定量金融,1https://EconPapers.repec.org/RePEc:taf:quantf:v:1:y:2001:i:2:p:223-桑德·迪尔曼、亚伦·范登奥尔德和凯伦·西蒙。现实主义音乐生成的挑战:以比例模拟原始音频。在S.Bengio、H.Wallach、H.Larochelle、K.Grauman、N.Cesa Bianchi和R.Garnett的《神经信息处理系统进展》中,编辑,第7989–7999页。Curran Associates,Inc.,2018年。统一资源定位地址http://papers.nips.cc/paper/8023-the-challenge-of-realistic-music-generation-modelling-raw-audio-at-scale.pdf.Adrian阿奎尔斯库博士和维克托·M·雅科文科。具有仓促波动性的赫斯顿模型中收益的概率分布。《定量金融》,2(6):443–4532002年。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 21:50