楼主: 何人来此
1178 29

[量化金融] 状态空间中快速近似推理的贝叶斯优化 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-8 10:15:28
未受干扰的模型)与O成比例减少() 在一些规律性假设下。此外,估计量的渐近高斯性和Bernstein-von Mises类型定理在足够小的范围内成立. 这是激发第2节中讨论的拉普拉斯近似的一个重要事实,我们在第6.1.4节构造对数p(θ| y1:T)的替代物中对这些性质进行了经验性研究。在本节中,我们简要讨论了gsa的步骤(ii)和(iii),其中我们构造了一个替代函数来模拟对数后验值。感兴趣的读者可参考Brochu等人[2010]了解更多详细信息。4.1高斯过程先验知识[Rasmussen and Williams,2006]是所谓的贝叶斯非参数模型的一个例子,可以解释为将多元高斯分布推广到有限维设置。因此,从gp中提取的实现可以被视为实值的有限向量(实数空间Rp上的函数)。为了构造代理函数,我们假设对数后验概率按对数p(θ| y1:T)分布~ 全科医生m(θ),κ(θ,θ). (10) 请注意,这与假设ssmis中参数的对数后验值为高斯分布不符。这里,GP(m,κ)表示由m(θ)=Ehlog p(θ| y1:T)i,κ(θ,θ)=Eh定义的均值函数m和协方差函数κ的GP对数p(θ| y1:T)- m(θ)对数p(θ| y1:T)- m(θ)i、 均值函数指定了过程的预期值,协方差函数指定了对数后验函数上任意一对点之间的相关性。协方差函数依赖于一组超参数,如控制依赖性的长度标度,详见Rasmussen and Williams[2006]。

12
mingdashike22 在职认证  发表于 2022-5-8 10:15:31
从(9)和图1中的clt,我们知道对数后验误差近似高斯,ξk=对数bpN(θk | y1:T)≈ 对数p(θk | y1:T)+σξzk,zk~ N(0,1),(11),其中σξ表示在算法后期估计的一些未知方差。因此,我们有任何测试点θ的预测后验概率?∈ Θ由log p(θ?| y1:T)|Dk给出~ 全科医生u(θ?| Dk),σ(θ?|Dk)+σξ, (12a)u(θ?| Dk)=m(θ?+κ(θ?、θk)hκ(θk、θk)+σξIk×ki-1nξk- m(θ?)o、 (12b)σ(θ?| Dk)=κ(θ?、θ?)- κ(θ?、θk)hκ(θk、θk)+σξIk×ki-1κ(θk,θ?),(12c)其中,我们引入了符号Dk={θk,ξk}来表示迭代k时可用的信息。对数后验函数的求值函数由(12)给出。计算预测后验概率的主要成本是由与O(k)成正比的矩阵求逆引起的。因此,gp的稀疏公式有助于降低大K的计算成本,见Rasmussen和Williams[2006]。4.2采集函数gp预测分布给出的替代函数为我们提供了对数后验概率及其不确定性的估计。如前所述,这是创建采集规则AQ(θ?| Dk)以平衡勘探和开发的有用信息。然后我们可以通过θk+1=argmaxθ来确定下一个点,在该点上对对数进行采样?∈ΘGPOAQ(θ?| Dk),其中Θgpode记录用户定义的搜索空间。在本文中,我们利用了预期改进(ei),因为它在数值计算中表现良好[Lizotte,2008]。为了证明ei规则,考虑预测的改善定义的asPI(θ?=最大值,对数p(θ?| y1:T)- umax- ζo,θ?∈ ΘGPO,(13),其中umax表示采样点θ的u(θ)的最大值∈ θk。在这里,我们引入ζasa参数,如Lizotte[2008]中所述,该参数控制开采/勘探行为。

13
大多数88 在职认证  发表于 2022-5-8 10:15:35
因此,对于ζ=0,我们有π(θ?)是后验值与采样点集合中假设的最大值之间的差异。因此,对数后验值大于当前峰值的点为正,所有其他点为零。ei规则通过计算(13)相对于(12)的期望值获得。这导致了θk+1给出的捕获规则=argmaxθ?∈ΘGPOσ(θ?|Dk)hZ(θ?)ΦZ(θ?)+ φZ(θ?)我+ ˇzk,(14)Z(θ?=σ-1(θ?| Dk)hu(θ?|Dk)- umax- ζi,其中φ和Φ分别表示标准高斯分布的密度和分布函数。在这里,我们通过添加高斯噪声来解决优化问题~ 协方差为∑的N(0,∑)。在实践中,这改进了勘探,提高了获得的参数估计的准确性。Bull[2011]和Gutmann and Corander[2016]也提倡抖动,以提高gpo的收敛速度。(14)中的优化可能是非凸的,但评估目标函数很便宜,因为它只相当于在一个点上评估gp预测后验值。我们利用无梯度分割矩形(direct;Jones et al.,1993)来求解ΘGPO上的(14),这是由先验分布p(θ)的支持确定的。5 GSA算法GSA(算法2)是通过结合smc abc(算法1)来近似对数后验点和GPO来创建一个模拟其模式周围对数后验点的替代函数而获得的。在本节中,我们将讨论该算法的一些用户选择和收敛结果。关于本文中使用的实现细节,请参见A。5.1初始化和收敛标准我们在第1行初始化算法2,为gp先验找到一些合适的超参数。

14
何人来此 在职认证  发表于 2022-5-8 10:15:39
超参数是使用拉丁超立方体采样获得的对数后验数据中的L个初始样本估计的。然后,我们对每个采样参数{θ?、θ?、…、θ?L}执行算法1,以获得?Lby是算法2中第4行的模拟。算法初始化后,我们可以在每次迭代或某个预先定义的时间间隔用第5行更新超参数。估计超参数的计算成本很高,因此建议只在固定的时间间隔内重新估计它们。该算法通常会执行一些预先定义的迭代次数K,直到ei小于一些EI>0,即直到k满足EI(θk|D)<工程安装。5.2从算法2中提取拉普拉斯近似,我们得到预测后验平均函数u(θ?| D),这有望成为对数后验的准确替代。然后,我们继续提取映射估计值bθ映射定义算法2使用以下输入找到对数p(θ| y1:T)的拉普拉斯近似值:算法1、p(θ)(参数先验)、m(θ)(平均函数)、κ(θ,θ)(协方差函数)、θ(初始参数)、∑(抖动协方差)和ΘGPO(优化边界)。输出:bθ映射(参数的估计)和bj(bθ映射)(后验协方差的估计)。1:使用一些初始数据D估计gp先验的超参数?L.2:将参数初始化为θ并设置k=1.3:当收敛标准不满足时,do4:通过算法1估计ξk=log bp(θk | y1:T),并设置Dk={D?L,θk,ξk}。5:(如果需要)在使用Dk之前更新gp的超参数。6:使用(12)构造gp代理日志p(θ?| y1:T)| dk。7:计算umax=argmaxθ∈θku(θ| Dk)。8:使用ΘGPO上的优化计算θk+1。9:设置k=k+1.10:结束,而11:通过使用ΘGPO上的优化来优化u(θ| Dk)来计算map估计值bθ。12:使用例如。

15
kedemingshi 在职认证  发表于 2022-5-8 10:15:42
μ(θ| Dk)上的有限差异。通过(4)。由于替代物平滑且评估成本低廉,我们可以使用标准方法(如直接算法)进行优化,以确定模式。对数后验J(bθ映射)的海森估计值可以通过有限差分格式、可能时通过解析计算u(θ?| D)的海森或使用拟牛顿算法求解(4)来计算。5.3收敛性文献中关于gpo算法收敛性的结果数量有限。通过将gpo算法与大量优化问题的备选方案进行对比,对大多数特性进行了数值研究。然而,Bull[2011]和Vazquez and Bect[2010]讨论了一些理论结果。他们得出结论,使用ei规则的gpo对对数后验数据进行密集采样,前提是它与gp前验数据是连续的。此外,gpo实现了O阶的最优收敛速度(K log K)-5/p(对数K)1/2对于Mat’ern 5/2协方差函数,其中k和p分别表示要推断的样本数和参数数。6数值说明和应用在本节中,我们提供了四个关于所提出算法的性质和优点的说明。实现细节收集在A中,带有数据的源代码可在GitHub下载:https://github.com/compops/gpo-smc-abc/.6.1高斯对数收益的随机波动率考虑高斯对数收益的随机波动率模型(gsv),x~ Nx;u,σv1.- φ!, (15a)xt+1~ Nxt+1;u+φ(xt)- u),σv, (15b)yt~ Nyt;0,exp(xt), (15c)参数θ={u,φ,σv}。在这里,假设潜在对数波动率遵循平均值为u的平均回复幅度∈ R、 持久性φ∈ (-1,1)和增量σv的标准偏差∈ R+。

16
mingdashike22 在职认证  发表于 2022-5-8 10:15:46
我们从这个模型生成一个合成数据集,T=500个观测值,参数θ={0.20,0.96,0.15}初始状态x=0。这个模型很有趣,因为它允许我们将gsa算法与使用标准粒子过滤器估计对数后验概率的算法进行比较。这是可能的,因为我们可以计算(15)的闭式gθ(yt | xt)。我们将该算法的这个版本称为gs,它对应于带有容差参数的gsaalgorithm = 0.在图2的左半部分,我们给出了gs(实心曲线)和pmh(柱状图)的后验估计值。我们首先观察到从gs到pmh获得的histogramapproximation的拉普拉斯近似的良好拟合;后验近似的位置和范围都是相似的。使用gs可使速度提高约30倍(15000/500)≈ 30)与pmh相比,后者被视为计算贝叶斯推断的黄金标准,两种算法的主要计算成本都是通过运行粒子过滤器(每次迭代运行一次)产生的。与运行粒子过滤器的计算成本相比,所提出算法的开销(估计gp中的超参数并计算预测后验值)可以忽略不计。我们现在继续分析gsa获得的拉普拉斯近似。在图2的右侧,我们展示了通过改变公差参数获得的后验近似值 介于0之间。1和0.5来研究近似值的偏差和稳健性。深灰色表示更大的公差参数。对于 = 0.1和0.2,我们发现近似值很差,偏差很大,对价差的影响很小。但是对于其他的选择, GSA的近似值很快收敛到类似于gs(实心曲线)。

17
大多数88 在职认证  发表于 2022-5-8 10:15:50
根据这些结果,我们得出结论,当 太小,近似值会随着时间的推移而变宽增加。因此,在后验近似中引入了偏差-方差权衡,具体取决于.我们继续将gs与spsa进行比较,后者是一种无梯度的替代方案,在许多应用中具有良好的收敛性和性能。spsa的运作方式是构建一个单位后验估计值-0.20.0.20.4 0.60 1 2 3 4 5 6 FP后验估计值0。70 0.75 0.80 0.85 0.90 0.95 1.000 2 4 6 8 10 12 14SV后验估计0。0.1 0.2 0.3 0.4 0.50 2 4 6 8-0.2 0.0 0.2 0.4 0.60 1 2 3 4 5 6后验估计0。10.20.30.40.50.70 0.75 0.80 0.85 0.90 0.95 1.000 2 4 6 8 10 12 14 Fposterior估值0。0.1 0.2 0.3 0.4 0.50 2 4 6 8SV后验估计图2:gsv模型中合成数据的边际参数后验值。左:实心曲线表示后面的拉普拉斯近似值,使用gs表示u(绿色)、φ(橙色)和σv(紫色)。直方图表示使用pmh估计的精确后验概率,深灰色(左)曲线表示先验分布。右图:三个参数的拉普拉斯近似(阴影区域)。灰色曲线(右)表示gsa使用不同公差参数值获得的拉普拉斯近似值 在abc近似下。0 100 300 500 700没有。对数后验样本M^0.20 0.30 0.40 0.500 100 300 500 7000.80 0.85 0.90 0.95个。记录后部样本F^0 100 300 500 700否。对数后验样本SV^0.20 0.30 0.40 0.50图3:作为对数后验样本数量的函数,来自gs(固体)和SPSA(固体圆环)的u(绿色)、φ(橙色)和σv(紫色)的map估计轨迹。第一个L=50个气体样本用于估计超参数。这两种算法总共运行700个对数后验样本。

18
大多数88 在职认证  发表于 2022-5-8 10:15:53
虚线表示pmh的后均值。每次迭代时梯度的差分近似值,之后在梯度方向上进行一步。注意,与gs中只有一个样本相比,spsa在每次迭代中需要两个对数后验估计。spsa的另一个可能缺点是,它只提供map估计,而没有对后验不确定性进行量化。在图3中,我们将两种算法的map参数估计作为对数后验估计数的函数进行比较。前L=50个对数后验样本用于估计gp前验的超参数。在这个初始阶段之后,gs使用大约一半的后验样本数快速收敛到合理的参数值。与spsa相比,使用该算法时,速度提高了2倍。6.2随机波动率模型α-稳定对数收益在图4的上半部分,我们展示了2013年6月至2014年12月期间期货合约的对数收益。这些数据似乎表明,2014年上半年前后出现了跳跃。

19
大多数88 在职认证  发表于 2022-5-8 10:15:58
这在财务数据中很常见,可以通过多种不同的方式进行建模。为此,我们考虑了byx给定的α稳定对数收益率(αsv)的随机波动率模型~ Nx;u,σv1.- φ!, (16a)xt+1~ Nxt+1;u+φ(xt)- u),σv, (16b)yt~ A.yt;α、 exp(xt), (16c)-10-5日日志返回联合国8月13日okt 13 12月13日2月14日4月14日6月14日okt 14 12月14日-1 0 1 2平滑日志波动率后验估计-0.4-0.2 0.0 0.2 0.4 0.6 0.80 1 2 FP后验估计0。75 0.80 0.85 0.90 0.95 1.000 2 6 8 10 12 SV后验估计0。0.1 0.2 0.3 0.4 0.5 0.6 0.70 2后验估计1。0 1.2 1.4 1.6 1.8 2.00 2 4 6 8图4:上限:期货的对数收益率(绿色)和对数波动率的估计值(深灰色)。阴影区域表示根据αsv模型,对数回报率的95%置信区间。中等和较低:αsv模型中的边缘参数后验值,由gsa(实心曲线)使用10次独立运行和μ(绿色)、φ(橙色)、σv(紫色)和α(品红)的pmh(直方图)估计。Darkgrey曲线表示先验分布。算法3使用αsv作为边际模型的Copula建模第1阶段(对每个资产i重复)1:运行算法2以获得对数波动率估计值bx1:T,i和参数估计值bθ映射,iof(16)。计算过滤后的日志回报率,ibybet,i=exp-bxt,我对于t=1,T.(17)2:估计由bgifrom{bet,i}Tt=1表示的累积分布函数(cdf)。计算残差的概率变换,但i=bGi(bet,i),对于t=1,T.(18)阶段24:推断copula的参数,以模拟{but,i}Tt=1}i=1之间的依赖关系。参数θ={u,φ,σv,α}和A(α,γ)表示具有稳定参数α的零均值对称α-稳定分布∈ (0,2)和标度γ∈ R+。

20
能者818 在职认证  发表于 2022-5-8 10:16:01
稳定性参数决定了分布的尾部行为,有关α-稳定分布及其性质的讨论,请参见Nolan[2003]。这种模型的可能性通常难以确定,因此需要近似值,例如使用abc进行粒子过滤。在图4的中下部,我们比较了10次独立运行的GSA(实心曲线)和pmh(直方图)获得的后验近似值。我们看到,对于这个模型,pmhis的混合非常差,因为直方图是峰值。这是一个常见的问题,因为如果对数后验估计值是有噪声的,马尔可夫链会被卡住。然而,后验估计重叠,似乎为gsa的每次运行提供了合理的参数值。主要差异在于α的估计,这可能是abc近似或可观测性问题的结果。最后,与对数收益率相比,对数波动率(黑色)的估计似乎是合理的。6.3计算石油期货投资组合的VaR我们遵循Charpentier[2015]构建copula模型,以捕捉石油期货合约价格之间的依赖结构。所考虑的数据如图5所示,包括1997年1月10日至2010年6月4日期间布伦特(北海出产)、迪拜(波斯湾出产)和玛雅(墨西哥湾出产)石油的每周收益。我们将数据集分为两部分,并利用前465个数据点来估计αsv和copula模型。剩下的233个数据点用于通过回溯测试验证模型。我们采用算法3中概述的常用两阶段copula建模方法,首先将边际模型分别安装到每个对数回归序列中,然后使用acopula对依赖结构进行组合建模[Joe,2005]。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 04:15