楼主: kedemingshi
658 17

[量化金融] 具有随机梯度的学习门限型投资策略 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-24 07:37:06
正如我们在备注1中所指出的,阈值函数中只应使用那些过程,这些过程并不意味着与日志返回无关。杠杆效应有几种定义,无论如何,它是股价变化和过去波动性之间的联系(即在我们的案例中,HTT和νt之间-1). 价格中没有杠杆效应的噪音,例如噪音项ηtin 2.5,在投资中没有优势。杠杆效应具有显著作用,因为这是我们利用波动性的唯一方式,但长记忆通常出现在波动性中。正如文献[13]所示,长内存隐藏在易失性中,而不是进程的漂移部分。在多元情况下,最优θivalues没有闭合形式。当然g级/θi=0必须满足。例如,在(2.16a)的二维版本中,最佳θ必须满足g级/θ=Z∞-∞v(θ- θx,x)f(θ- θx,x)dx=0,(2.17a)g级/θ=Z∞-∞-xv(θ)- θx,x)f(θ- θx,x)dx=0,(2.17b)方程,其中v(x,y):=E[Ht | Ht-1=x,Ht-2=y],f(x,y)是(Ht)的联合pdf-1,Ht-2). 如果我们希望包括对数波动率νt,则DGSV情况下的方程更复杂-1然后我们需要替换变量x→ exp(x)并重新解释pdf和条件平均值(使用eνt-1代替Ht-2、这些通常是未知函数,我们只能根据与我们的目标相反的数据来估计pdf和ConditionalExpection。这并不意味着Kiefer-Wolfowitz算法不能收敛到最优θ,只是我们不能提前计算出它们的最优值。如果动力学已知,则可以使用蒙特卡罗方法来估计最优值。这就是我们在数值模拟中使用的。在这里,我们想展示如何将基弗-沃尔福威茨算法用于投资目的的基础知识。

12
mingdashike22 在职认证  发表于 2022-6-24 07:37:10
也可以使用其他流程。3基弗-沃尔福威茨算法根据基弗-沃尔福威茨优化程序,我们正在寻找(2.11)的最大值。单变量情况:任务是找到最佳阈值θ*∈ Rmaximizeθg(θ):=E[Ht{Xt-1> θ}],(3.1)随机过程Ht和Xt-1均为单变量。让我们用G(θ;Ht,Xt)表示时间t的增长-1) :=Ht{Xt-1>θ}. 随机梯度算法使用增长的有限差异:θt+1=θt+atG(θt- 计算机断层扫描;Ht,Xt-1) - G(θt+ct;Ht,Xt-1) ct,(3.2),其中步长At和有限差分ct的步长是实值序列。分数是梯度的近似值。自增长G(θ;…)是θ的指示函数,因此其有限差可以简化为一个范围。为了更清楚,我们表示范围[x- c、 x+c]为[x±c]。然后,算法可以写成θt+1=θt+atHt{Xt-1.∈[θt±ct]}ct。(3.3)这种形式主义将有助于我们在后者中更好地理解该方法的使用。一般来说不可能证明,但通过第4节中的一些示例,我们可以清楚地表明,这种递归更新收敛到我们在前一节中所示的最优值:θtL--→ θ*, (3.4)收敛在L中,即我们可以显示均方误差(MSE)的收敛性。如果收敛完成,其速度通常具有幂律。一般来说,没有直接的方法来选择超参数。在第4节中,我们展示了一些想法,在此基础上我们可以选择超参数。在现实投资中,金融环境不是静态的,价格动态可能会发生变化,新因素可能会出现/消失,因此最优策略也会发生变化。

13
大多数88 在职认证  发表于 2022-6-24 07:37:13
为此,在实践中,投资者使用恒定和非常小的步长At和Ct,它们能够跟踪最优值的变化。在本文中,我们的目标不是关注市场的变化。多变量情况:算法以相同的方式工作,参数的每个维度分别更新,没有交叉影响。例如,在已知对数波动率(2.16b)的情况下,增长G(θ,θ;Ht,Ht-1,νt-1) θt+1=θt+atHt{Ht-1.∈[θt-θteνt-1±ct]}ct(3.5a)θt+1=θt+atHt{Ht-1.∈[θt-θteνt-1±cteνt-1] }ct(3.5b)4数值结果每个算法的关键部分是超参数的选择。在他们的论文中,J.Kiefer和J.Wolfowitz[6]也讨论了参数选择的问题,尽管他们能够在更简单的背景下给出准确和有效的条件。这些条件是典型的要求,我们的模型也满足这些要求:1。计算机断层扫描→ 0.2.P∞t=1at=∞, 也就是说,该算法可以达到任何状态。3、P∞t=1atct<∞.θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】Ht[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E[Ht]E【Ht】E【Ht】E【Ht】E【Ht】0.00.10.20.3-2 0 2θgu=0.15,α=0.5,σ=0.75AR(1)模型:g(θ)(a)Log return是一个AR(1)过程θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*θ*E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】E【Ht】0.10.20.30.4-4.-2 0 2 4θgu=0.15,α=0.5,σ=0.75,ρ=-0.2,b0=0.4,b=0.7DGSV模型:g(θ)(b)日志返回是一个DGSV过程图1:函数θ→ g(θ)。

14
mingdashike22 在职认证  发表于 2022-6-24 07:37:16
两个图都显示了Ht的0.01和0.99%范围内的θ值。4、P∞t=1atc-2t<∞.通常的第一猜测选择是at=t-1和ct=t-1/3.分析单变量情况下的增长函数g(θ)有助于我们以合适的方式构造步长。图1和(3.3)表明θt必须保持在与Xt相同的范围内-1,自Xt起-16∈ [θt±ct],t型∈N将导致常数θt。在数值模拟中,我们仅显示关于Xt的结果-1: =Ht-1案例。在这两个例子中,我们可以做出以下评论:og(θ→ -∞) = E[Ht],低θ意味着πt=1,即财富等于股票价格g(θ→ ∞) = 0,高θ意味着π=0,财富等于债券价格在简单的情况下,当HTS是一个自回归过程,并且当它具有更复杂的现实动力学DGSV时,存在唯一的θ*这是可以计算出来的如果θt的值超出了htg(θ)的导数为零的典型值,那么算法返回是没有希望的,它会停留在那里。为了克服最后一句话的问题,我们对算法进行了一些修改。首先,必须在Ht的小样本上估计初始值θ。在每个实现中,我们使用10个数据点来初始化θ:=Pt=10Ht/10。这个非常小的样本已经足够让算法从一个相对较好的点开始。其次,我们不能让算法采取任何大的步骤。一般的解决方案是在子空间中使用一个项目θ。在我们的例子中,我们对已知的Ht范围进行截断:θt=最小1≤j≤tHj,如果|θt<min1≤j≤tHj,|θt,否则,max1≤j≤tHj,如果|θt>max1≤j≤tHj,其中|θ:=θt-1+atHt{Ht-1.∈[θt-1±ct-1] }/ct-1、使用简单的参数化at=t-1和ct=t-1/3可以在简单的环境中工作。图2显示了超参数工作的简单选择。以N=25个实现和T=50000个时间步执行模拟。

15
大多数88 在职认证  发表于 2022-6-24 07:37:19
均方误差(MSE)是误差的近似值。误差的对数标度图表明,在这两种情况下,均方误差都有幂律衰减。要求,即Ht-1如果我们对过程进行缩放,则在很大一部分时间内,必须保持在[θt±ct]范围内。如果我们以某种方式调整算法的步骤,这个问题就可以得到解决。因为问题在阶跃函数Ht中-1.∈ 【θt±ct】,步骤ct必须反映过程的规模(Ht-1和0 20000 50000-1.0 0.0 1.0AR(1)时间步长θt1 1000.002 0.050时间步长mse(a)a子图0 20000 50000-1.0 0.0 1.0dgsv时间步长θt1 1000.05 0.20时间步长mse(b)A子图2:Kiefer–Wolfowitz算法在LF中的收敛,如1所示。左图显示了5-5个实现,而右图显示了所有实现的均方误差(MSE)。θ皮重相同)。如果我们重新缩放ctvariable,那么我们还需要补偿at/ctterm。因此,步骤如下:at=Kt-p、 ct=Kt-q、 (4.1)式中,K等于Ht的标准偏差。这可能是对标准偏差的估计,但对于隐含性,我们使用整个数据集来估计它。在ATA和CTI上使用比例因子K的性能如表1所示!!!和图!!!。表中显示了t=t=100 000时的均方误差,而图中显示了函数t→ MSEtwith different scaling不同的缩放。下表和图的参数设置见(4.2)和(4.3)。在数据集-2中,当α较小时,尽管过程的变化较大(在AR(1)情况下,变化为σ/(1),但均方误差较高- α)). 这是因为α越低,我们拥有的信息越少,学习起来就越困难。

16
kedemingshi 在职认证  发表于 2022-6-24 07:37:22
图3和图4显示,在不缩放算法的情况下,首先等待一个合适的大小,而使用缩放可以加快这一速度,并且算法使用合适的ct。数值结果还表明,缩放过程的最佳方法是使用过程标准偏差的五倍。数据集1:u=0.01,α=0.5,σ=0.05,ρ=-0.2,b=0.4,b=0.7。(4.2)数据集2:u=0.005,α=0.2,σ=0.05,ρ=-0.2,b=0.4,b=0.7。(4.3)(在AR(1)中,只有u、α、σ有意义。)缩放AR(1)DGSVDataset-1(×10-6) 数据集-2(×10-5) 数据集-1(×10-6) 数据集-2(×10-5) 无标度7.8 1.8 6.7 19.2K=st.dev.(Ht)11.4 17.9 53 120.0K=st.dev.(Ht)5 1.7 1.6 20 8.8表1:步骤At和ct的不同标度下的算法性能。1 100 100001e-05 5e-04 1e-02时间步长MSEDataset 1,无缩放1 100 100001e-05 1e-04 1e-03时间步长MseDataSet 1,K=标准(H)1 100 100001e-06 5e-05时间步长MseDataSet 1,K=标准(H)*51 100 100002e-05 2e-04 2e-03MSEDataset 2,无缩放1 100 100002e-04 5e-04MSE数据集2,K=标准(H)1 100 100002e-05 2e-04 2e-03MSEDataset 2,K=标准(H)*5图3:研究AR(1)两种不同参数化的不同缩放效果。参数见(4.2)和(4.3),结果见表1.1 100 100002e-06 5e-05 2e-03时间步长MSEDataset 1,无缩放1 100 100005e-05 5e-04时间步长MseDataSet 1,K=标准(H)1 100 100001e-05 2e-04 5e-03时间步长MseDataSet 1,K=标准(H)*51 100 100002e-04 1e-03 5e-03MSEDataset 2,无缩放1 100 100002e-04 1e-03MSEDataset 2,K=std(H)1 100 100005e-05 5e-04 5e-03MSEDataset 2,K=标准(H)*5图4:研究DGSV两种不同参数化的不同缩放效果。

17
可人4 在职认证  发表于 2022-6-24 07:37:25
参数见(4.2)和(4.3),结果见表1。资助第一作者衷心感谢2018/2019年人力资源部(项目编号:'UNKP-18-3-IV-PPKE-21)的'Uj Nemzeti Kiválóság项目的支持。第二作者感谢匈牙利科学院“Lendület”赠款LP 2015-16(Lendület赠款LM 2015-16)的支持,以及NKFIH(匈牙利国家研究、发展和创新办公室)赠款KH126505的支持。参考文献【1】Kendall Kim。电子和算法交易技术:完整指南。学术出版社,2010年。[2] 艾琳·奥尔德里奇。高频交易:算法策略和交易系统实用指南,第604卷。John Wiley&Sons,2013年。[3] 李斌和陈海燕。在线投资组合选择:一项调查。ACM计算调查(CSUR),46(3):352014年。[4] 马科斯·洛佩斯·德普拉多。金融机器学习的进展。John Wiley&Sons,2018年。[5] 赫伯特·罗宾斯和萨顿·蒙罗。一种随机近似方法。《数学统计年鉴》,第400-4071951页。[6] 杰克·基弗,雅各布·沃尔福威茨,等。回归函数最大值的随机估计。《数理统计年鉴》,23(3):462–4661952年。[7] Zhenhua Zhang、G Yin和Zhian Liang。美式lookbackput期权的随机逼近算法。《随机分析与应用》,29(2):332–3512011。[8] G Yin、Qing Zhang、F Liu、RH Liu和Y Cheng。使用纳斯达克每日和日内数据通过随机近似进行股票清算。《数学金融:国际数学、统计和金融经济学杂志》,16(1):217–2362006年。[9] Yinlam Chow和Mohammad Ghavamzadeh。mdps中cvar优化算法。《先进的神经信息处理系统》,第3509–3517页,2014年。[10] 苏菲·拉鲁埃尔和吉勒斯·帕格斯。

18
大多数88 在职认证  发表于 2022-6-24 07:37:28
将平均创新的随机近似应用于金融。蒙特卡罗方法与应用,18(1):1–512012。[11] Andrey Kibzun和Riho Lepp。投资组合分位数问题的离散逼近。InStochastic优化:算法和应用,第121–135页。斯普林格,2001年。[12] 苏菲·拉鲁埃尔、查尔斯·阿尔伯特·莱哈勒和吉勒斯·佩奇。流动性池中订单的最优分割:一种随机算法方法。《暹罗金融数学杂志》,2(1):1042–10762011。[13] Rama Cont.《资产回报的经验性质:程式化事实和统计问题》。QuantitativeFinance,第223–236页,2001年。[14] Paul H Algoet,Thomas M Cover,等。对数最优投资的渐近最优性和渐近均分性质。《概率年鉴》,16(2):876–8981988。[15] Zsolt Nika和Miklos Rasonyi。记录具有记忆效应的最佳投资组合。《应用数学金融》(Applied MathematicalFinance),第1-29页,2018年。[16] 科林·卡梅隆和普拉文·K·特里维迪。微观计量经济学:方法与应用。剑桥大学出版社,2005年。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 16:44