楼主: 大多数88
1024 25

[量化金融] 金融交易策略的生成性对抗网络 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-6-11 09:00:05
此参数在调节可用于抽取样本、评估和选择的CGAN数量方面起着相关作用。为了说明算法1的选择部分,图1给出了it toSPX指数的敏感性分析。总体而言,在前2000年急剧下降后,我们观察到RMSE稳定在0.018水平。提取更多的样本可以改进估计,但从20到100个样本中,盖尼几乎无法察觉。快照频率是一个重要参数,在100到2500之间有明显的差异,但从100到500没有太大变化。Ex(a)(b)(c)(d)(e)(f)中也报告了从Gand中提取的样本数量和快照频率。图2:cGAN在不同时期的SPX指数日志回报(a-c),以及各自的累积回报(d-e)。实验设置部分。图2显示了cGAN的SPX指数样本(a-c)及其在不同训练阶段(200、1000和5000个时期)的累积回报(d-e)。很明显,只有200个时代的样本生成与指数不太相似,而1000个时代的结果更接近。对于SPX指数,在1000-2000年之后没有观察到太多的改善。虽然样本仍然与指数相似,但与预测中的缩放和超调相关的一些问题损害了RMSE值。图3使用1000个时代的cGAN样本研究了估计自相关(ACF)和偏自相关(PACF)函数。除少数例外情况外,大多数观察到的ACF和PACF值都在几个LCGAN样本的平均值附近,置信区间(CI)覆盖了63个滞后中的大部分;这一轶事证据表明,我们的cGAN训练和选择算法能够在一定程度上复制时间序列的某些统计特性,尤其是其ACF和PACF。

12
何人来此 在职认证  发表于 2022-6-11 09:00:08
我们的案例研究中提供了支持这最后一种说法的适当证据。最后一点:我们采用均方根误差作为发电机样本和实际数据之间的损失函数,但是没有任何限制用户使用另一种类型的损失函数。在接下来的两小节中,我们将概述使用Gan生成器可以实现的新应用:微调和交易策略的组合。我们之所以特别强调这一时期,是因为我们的分析和结果集中于2001-2013年的样本。(a) (b)图3:使用具有1000个时代的cGAN的SPX指数的自相关(a)和偏自相关(b)。2.4 cGAN:交易策略的微调交易策略的微调包括确定一组合适的超参数,以达到预期目标。这一目标取决于定量分析师所针对的效用函数P是什么:在活跃交易中表现优异,对冲特定风险,达到一定的风险调整回报水平,等等。这个问题可以分解为两个紧密联系的任务——模型验证和超参数优化。使用[7]作为初始步骤,givena(n):o示例X(序列)的有限集合从概率分布px(X)中得出o超参数λ的集合∈ ∧,如神经元数量、j层的激活函数等。o效用函数P,用于衡量交易策略Sλ在面对px(x)新样本时的表现。o交易策略Mλ的参数θ可通过优化训练标准识别,但只有在以数学方式执行某个λ后,才能进行适当调整,如果我们能够识别:λ*= arg最大λ∈∧Ex~px[P(x;Mλ(x(train)))](3)即Mλ的最佳配置*这最大化了效用P的推广。

13
可人4 在职认证  发表于 2022-6-11 09:00:11
实际上,由于很难从PX中提取新的示例,并且∧可能非常大,因此超参数优化和模型验证中的大部分工作都是通过一个双重近似来完成的:λ*= arg最大λ∈∧Ex~px[P(x;Mλ(x(列)))]≈arg最大λ∈{λ,λ,…,λm}Ex~px[P(x;Mλ(x(列)))]≈ (4) arg maxλ∈{λ,λ,…,λn}平均x∈X(val)[P(X;Mλ(X(train)))](5)第一个近似值(等式4)是对λ的搜索空间进行离散化(希望包括λ*) 由于计算量有限。有更好的方法来进行这种搜索,例如使用进化策略【25】或贝叶斯优化【13】,但这不是我们工作的重点。二次近似(公式4)用验证集X(val)的平均值代替了px的期望过采样。创建适当的验证集一直是大量研究的重点:o当x。。。,xnare独立同分布采样(iid),可以使用k-foldcross-validation[6]和iid bootstrap[3]等技术创建X(train)和X(val)。o当x。。。,如果不是iid,则必须进行修改,以充分创建X(序列)和X(val)。就其本身而言,这是一个正在进行的研究课题,但我们可以提到块交叉验证和HV块交叉验证[31]、滑动窗口[3]、onesplit(single holdout)[3]、固定引导[24]作为潜在候选。在这项工作中,我们遵循一条不同的思路:我们试图使用cGAN从PX绘制新示例的近似方法。

14
nandehutu2022 在职认证  发表于 2022-6-11 09:00:14
算法2概述了使用cGAN生成器确定交易策略所遵循的步骤。算法2使用cGAN1微调交易策略:程序cGAN([y,…,yT],参数)2: 训练并为时间序列y选择cGAN。。。,yT3:返回G,D4:结束程序5:程序cGAN微调(G,[y,…,yT],B)6:用于λ← λ, ..., λmdo7:对于b← 1,B do8:用于t← p+1,T do9:采样噪声向量z~ pz(z)10:绘制y*t=G(z | yt-1.年初至今-p) 11:结束12:列车数据:X(列车):=(y*p+1。。。,y*T-h) 13:fit交易策略:M(b)λ(X(train))14:val数据:X(val):=(y*T-h+1。。。,y*T) 15:性能:s(b)λ=P(X(val);M(b)λ(X(列车)))16:结束17:平均:性能(λ)=(1/b)PBb=1s(b)λ18:结束19:返回arg maxλ∈{λ,λ,…,λm}perf(λ)20:结束过程,我们训练一个cGAN并使用生成器G从时间序列中绘制B样本。对于每个样本,我们进行一次拆分以创建X(train)和X(val),这样我们就能够识别Mλ参数λ并评估一组高参数λ。根据公式(5),我们返回超参数λ*使cGAN样本的平均性能最大化。一次拆分方法有一个参数h,用于设置保持集大小;其值在实验设置部分中有规定。我们将我们的方法结果与从给定数据集生成X(train)和X(val)的其他方案进行了比较。Nextsubsection概述了cGAN生成器的另一个用途:集成建模。2.5 cGAN:抽样和聚合cGAN的另一个潜在用途是构建交易策略的集合,即使用个别“弱”的基础学习者(如分类和回归树),但聚合后可以胜过其他“强”学习者(如支持向量机)。这一原则的臭名昭著的实例是随机森林、梯度提升树等,这些技术利用装袋、提升或堆叠[12,17]。

15
nandehutu2022 在职认证  发表于 2022-6-11 09:00:18
在我们的例子中,我们可以得出的最接近cGAN抽样和聚合的平行结果是装袋。算法3显示了此方法。在训练和选择了一个cGAN后,我们反复抽取acGAN样本并训练一个基础学习者;以这种方式处理b=1。。。,B步骤我们将整个基本模型集作为一个集合返回。一个经常用来说明为什么这个图式是方差缩减引理的论点【17】:let^Y。。。,^ybe是一组基础学习者,每个学习者都使用distinctAlgorithm 3 cGAN抽样和聚合1:程序cGAN([y,…,yT],params)2: 训练并为时间序列y选择cGAN。。。,yT3:返回G,D4:结束程序5:程序cGAN Sample Agg(G,[y,…,yT],B)6:用于B← 1,B do7:用于t← p+1,T do8:采样噪声向量z~ pz(z)9:绘制y*t=G(z | yt-1.年初至今-p) 10:结束11:训练基地学员:M(b)λ(y*p+1。。。,y*T) 12:结束13:返回系综M(1)λ。。。,M(B)λ14:结束程序从cGAN生成器重复采样。然后,如果我们平均他们的预测并分析其方差,我们得到:VhBBXb=1^Ybi=BBXb=1V[^Yb]+2BX1≤b≤j≤BC[^Yb,^Yj](6) 如果出于分析目的,我们假设所有b的V【^Yb】=σ和C【Yb,Yj】=ρσ,即方差σ和平均相关性ρ相等,则该表达式简化为:VhBBXb=1^Ybi=σB+B- 1Bρ≤ σ(7)因此,我们能够通过平均许多略微相关的预测值来减少基础学习者方差。通过BiasVariance trade-o fff[12,17],总体均方误差趋于最小化,尤其是当使用低偏差和高方差基础学习器时,如深层决策树。预测因子库的多样化是关键因素;通常,它是通过从数据集中获取Biid引导样本来实现的。在处理时间序列时,iid引导可能会破坏其自相关结构,最好采用B个平稳引导样本[24]。

16
mingdashike22 在职认证  发表于 2022-6-11 09:00:21
因此,使用平稳引导的Bagging预测值是比较样本和聚合的合适基准。能够产生σ较低且尽可能轻微相关的^Yband^yjj的方法往往优于样本外的方法。最后一点:一个潜在的风险是cGAN无法复制良好的pdata。因此,虽然样本更加多样化,但他们也更加“有偏见”。这可能会使基础学习者错过realdataset中显示的模式,甚至发现在FirstPlace中不存在的模式。3实验设置3.1数据集和保持设置表1显示了与所用数据集相关的聚合统计数据,而图4显示了每个资产池的累积回报率。我们在评估期间考虑了三种主要资产类别:股票、货币和固定收益。数据来自彭博社,有579个资产清单和有效期https://www.dropbox.com/s/08mjq7z49ybftqg/cgan_data_list.csv?dl=0.典型的时间序列始于2000年1月3日,于2018年3月2日结束,平均长度为4565个数据点。我们使用3个月伦敦银行同业拆借利率(Libor)作为基准利率,将原始价格转换为超额对数回报。图4:整个资产池的累计回报。在进行平均之前,每个资产的波动率都被缩放到10%。我们建立了一个测试程序,以评估本研究中跨越的所有不同方法。图5总结了整个过程。该过程通过拆分返回序列r、…、。。。,RTI在单一样本/训练(IS)和外样本/测试/保持(OS)集合中,两个集合的大小都由训练水平h确定。在我们的实验中,我们得到的fixedh=1260天≈ 5年。所使用或使用的每种方法都只会访问IS数据。

17
能者818 在职认证  发表于 2022-6-11 09:00:24
一些方法,如其他模型验证方案,将创建训练和验证序列,但所有这些方法都仅基于onIS集合。然而,用于衡量他们成功的数据是相同的:通过使用fixedos集计算一组指标。图5:一种分割/单一坚持的方法来评估这项工作中的所有方法。在我们的实验中,我们确定h=1260天≈ 5年。表1:我们在实证评估期间使用的资产的汇总统计数据。资产池*N平均回报波动率夏普比率Calmar比率月度偏斜度风险值95%所有资产579 0.0220 0.0453 0.4854 0.1051-1.2169-0.9443世界股票指数18 0.0152 0.0717 0.2114 0.0504-0.8170-1.0048S&P 500,FTSE 100和DJIA Equities 491 0.0251 0.0525 0.4785 0.1127-1.1133-0.9517世界掉期指数48-0.0191 0.0446-0.4295-0.0458 0.0275-0.9753利率合计指数16 0.1220 0 0.0637 1.9135 0.5504-0.8227-0.9440世界货币24-0.0025 0.0315-0.0798-0.0157-1.0052-0.8856*,然后进行平均,每个单项资产的波动率按比例调整为10%。3.2绩效指标本小节概述了所采用的效用函数。我们选择了财务绩效指标,而不是基于预测误差的一般指标。低预测误差是必要的,但不是构建阿尔法生成交易策略的有效条件[1]。从这个意义上说,我们主要报告了夏普和卡尔玛比率:将风险和回报指标相结合的指标,并使不同的投资策略具有可比性[14、35、40]。这些度量可以定义为:SR=(R)R(M)σ(M)和CR=(R)R(M)-MDD(R(M))(8)其中,R(M)是策略平均年化超额收益,σ(M)是it波动率,MDD(R(M))是策略最大提取。所有这些都是以策略瞬时收益r(M)t=rt·f(^rt)作为构建块来计算的。

18
nandehutu2022 在职认证  发表于 2022-6-11 09:00:27
在这种情况下,f(^rt)是我们的交易信号,是预测模型得出的估计收益率的转换f。我们选择对f(^rt)=^rt使用一个恒等式函数,这样可以避免超参数的另一层;实际上,用户可以选择其他转换。最后,应该提到的是,我们报告的大多数结果都是在所有579项资产中汇总的。虽然这些比率提供了一个共同的基础来比较不同风险类别的分类,但资产池仍然非常多样化,并且受到异常值的影响。因此,我们选择稳健统计(中位数、平均绝对偏差、分位数、等级等)来比较和统计检验不同的假设。3.3 cGAN配置表2概述了用于cGAN的Gand和D的三种不同架构。由于主要的变化是使用的神经元数量,我们将这些病例的名称缩写为cGAN Small、cGAN Medium和cGAN Large。这种变化将允许我们检查不同架构大小在基准测试中的表现。经过几次初始运行后,我们选择学习率为0.01、批量为252的随机梯度下降作为优化算法。

19
可人4 在职认证  发表于 2022-6-11 09:00:30
输入特征和目标有兴趣了解本研究中使用的非参数统计检验的更多信息的读者——Friedman、Holm Correction和Wilcoxon秩和检验——应参考本参考文献【10】。表2:用于训练和选择机器人的配置。缩写单个配置cGAN小(G,D)神经元数量=(5,5)cGAN中(G,D)神经元数量=(100100)cGAN大(G,D)神经元数量=(500500)其他配置值体系结构多层感知器隐层数量1隐层激活函数线性阵列输出层激活函数线性阵列输出层激活函数sigmoidepochs20000Batch Size 252Solver随机梯度DescentSolver参数学习率=0.01条件信息rt-1,rt-2.rt公司-252(p=252)噪声优先pz(z)N(0,1)噪声维度dim(z)252快照频率(snap)200用于评估的样本数C=50输入特征缩放函数z分数(标准化)目标缩放函数z分数(标准化)使用z分数函数缩放,以简化训练过程。我们选择了正确的cGAN,每200次迭代进行一次快照(snap=200),绘制并评估20000个时代中每个生成器的50个样本。最后,我们使用252个连续的滞后作为条件信息(大约一年),噪声先验(StandardNormal-N(0,1))使用条件输入的相同维度;我们这样做是为了增加创建更多样化示例池的机会,并使生成器更难忽略/取消与输入层这一部分相关的权重。3.4案例一:交易策略组合3.4.1概述本案例评估不同交易策略组合的成功。

20
能者818 在职认证  发表于 2022-6-11 09:00:33
从这个意义上讲,算法4呈现了用于CGAN和静态引导的主循环。第一步是对实际返回值RS(r,…,rT)重新采样-h) 使用静态引导或cGAN,创建一个新的返回序列{r*, ..., r*T-h} =X(列车)组。然后我们照常进行:使用X(train)来训练基础学习者M(b)λ,并将其添加到集合ES中。所有这些步骤都重复b次。最后,我们可以通过集成ES传播OS特性集,获得聚合预测,并计算其在该保持集内的性能。算法4用于策略组合的通用循环1:用于b← 1,B do2:X(列车):={r*, ..., r*T-h} =RS(r,…,rT-h) 3:fit交易策略:M(b)λ(X(train))4:添加到集合:ES← M(b)λ(X(列))5:结束6:测试系综:P(rT-h、 。。。,rT;Agg(ES))3.4.2 Methods and ParametersTable 3介绍了算法4的RS、Mλ和Agg的实例化。主要的竞争方法是静态自举法;对于所有RS方案,我们都采取了不同数量的重采样B,以便我们可以比较不同大小的集合的效率。我们使用了两个主要的基础学习器:深度回归树和大型多层感知器。其主要思想是遵循使用低偏差和高方差学习者的通常原则。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 17:02