楼主: 何人来此
1174 29

[量化金融] 状态空间中快速近似推理的贝叶斯优化 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-5-8 10:14:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Bayesian optimisation for fast approximate inference in state-space
  models with intractable likelihoods》
---
作者:
Johan Dahlin, Mattias Villani and Thomas B. Sch\\\"on
---
最新提交年份:
2017
---
英文摘要:
  We consider the problem of approximate Bayesian parameter inference in non-linear state-space models with intractable likelihoods. Sequential Monte Carlo with approximate Bayesian computations (SMC-ABC) is one approach to approximate the likelihood in this type of models. However, such approximations can be noisy and computationally costly which hinders efficient implementations using standard methods based on optimisation and Monte Carlo methods. We propose a computationally efficient novel method based on the combination of Gaussian process optimisation and SMC-ABC to create a Laplace approximation of the intractable posterior. We exemplify the proposed algorithm for inference in stochastic volatility models with both synthetic and real-world data as well as for estimating the Value-at-Risk for two portfolios using a copula model. We document speed-ups of between one and two orders of magnitude compared to state-of-the-art algorithms for posterior inference.
---
中文摘要:
我们考虑具有难处理似然性的非线性状态空间模型中的近似贝叶斯参数推断问题。序贯蒙特卡罗近似贝叶斯计算(SMC-ABC)是一种在这类模型中近似概率的方法。然而,这种近似可能会有噪声,计算成本高,这阻碍了使用基于优化和蒙特卡罗方法的标准方法的有效实现。我们提出了一种基于高斯过程优化和SMC-ABC相结合的计算效率高的新方法,以创建难以处理的后验概率的拉普拉斯近似。我们举例说明了在随机波动率模型中使用合成数据和真实数据进行推理的算法,以及使用copula模型估计两个投资组合的风险价值的算法。与最先进的后验推理算法相比,我们记录了一到两个数量级的速度提升。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Computation        计算
分类描述:Algorithms, Simulation, Visualization
算法、模拟、可视化
--
一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Bayesian_optimisation_for_fast_approximate_inference_in_state-space_models_with_.pdf (1 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:状态空间 贝叶斯 Optimisation Applications Quantitative

沙发
能者818 在职认证  发表于 2022-5-8 10:14:58
具有难处理概率的快速近似推理instate空间模型的贝叶斯优化Johan Dahlin、Mattias Villani和Thomas B.Sch¨on*2017年6月14日摘要我们研究了具有难处理概率的非线性状态空间模型中的近似贝叶斯参数推断问题。序贯蒙特卡罗近似贝叶斯计算(smc abc)是一种在这类模型中近似概率的方法。然而,这种近似可能会有噪声,计算成本高,这阻碍了使用基于优化和蒙特卡罗的标准方法的高效实现。我们提出了一种基于高斯过程优化和smc abc相结合的计算效率改进方法,以创建难以处理的后验概率的一个近似值。我们举例说明了在随机波动率模型中使用合成数据和真实数据进行推理的算法,以及使用copula模型估计两个投资组合的风险价值的算法。我们记录了与最先进的后验推理算法相比,速度提高了一到两个数量级。关键词:α稳定分布,近似贝叶斯计算,贝叶斯推理,高斯过程优化,序贯蒙特卡罗*给通讯作者的电子邮件:liu@johandahlin.com.JD和MV在林克平大学计算机与信息科学系工作。TS在瑞典乌普萨拉大学信息技术系工作。这项工作主要是在JD在林克平大学电气工程系自动控制部工作期间进行的。1简介时间序列数据的动力学建模是许多科学领域的重要组成部分,包括统计学[Durbin and Koopman,2012]、计量经济学[McNeil et al.,2010]和工程学[Ljung,1999]。

藤椅
mingdashike22 在职认证  发表于 2022-5-8 10:15:02
一个流行的动态模型是状态空间模型(ssm),它可以用X表示~ μθ(x),xt | xt-1.~ fθ(xt | xt)-1) ,yt | xt~ gθ(yt | xt),(1)式中θ∈ Θ  表示未知的静态参数。给,xt∈ 十、 Rnx和yt∈ Y Rnyde记录了潜伏期和时间t的观察结果∈ 分别为{0,1,…,T}。通过分别使用已知的概率密度u、fθ和gtheta,对初始状态、状态动力学和观测值的分布进行建模。在本文中,我们感兴趣的是使用贝叶斯方法估计ssms中的未知参数θ。这相当于计算p(θ| y1:T)=p(θ)pθ(y1:T)ZΘp(θ)pθ(y1:T)dθ给出的参数后验分布,(2)其中p(θ)和pθ(y1:T),p(y,y,…,yT |θ)分别表示参数的先验分布和似然。对于ssm,我们无法以闭合形式计算后验概率,因为似然Pθ(y1:T)取决于未知的潜态x0:T。幸运的是,通过所谓的序贯蒙特卡罗(smc;Doucet and Johansen,2011)或粒子滤波算法,可以获得似然的无偏估计。然而,对于一些感兴趣的模型,由于gθ(yt | xt)是一个解析的封闭形式表达式,是递归定义的,或者计算上不允许计算,因此不可能使用smc。我们将这类模型称为具有难以解决的可能性的SSM。一个例子是,将α稳定分布[Nolan,2003]用作(1)中的gθ,以模拟观测中的重尾噪声。斯托亚诺夫等人最近提倡这种建模方式。

板凳
何人来此 在职认证  发表于 2022-5-8 10:15:05
[2010]等,以捕捉金融指数和股票价格的行为,通常表现出所谓的跳跃。获得难以解决的可能性有偏估计的一种方法是将近似贝叶斯计算(abc;Marin等人,2012)与smc结合使用[Jasra等人,2012]。然后可以使用标准推理算法估计参数θ。然而,smc abc获得的估计值通常会受到较大方差的影响,且计算成本较高。这通常会导致完整推理算法的长期运行时间(天),这在实际应用中是禁止的。在本文中,我们提出了一种计算效率高的算法,用于具有难处理似然性的SSM中的贝叶斯推理。提出的算法称为gsa,是高斯过程优化(gpo;Brochu等人,2010)和smc abc的组合。gsa的目的是构造一个近似(2)的拉普拉斯近似。该算法的有效性源于gpo对后验评估的要求非常低,并且与其他优化算法相比,该算法对噪声的鲁棒性更强。这主要是因为gpo通过构造一个代理函数来运行,该函数模拟(2)与Wood[2010]的相似性。由此产生的替代物是平滑的,且计算成本低,因此可以使用标准优化方法来提取模拟真实后验曲线的替代物拉普拉斯近似值。本文的主要贡献是介绍、发展和数值研究gsa算法。我们将提出的算法与粒子Metropolis Hastings(pmh;Andrieu等人,2010年,Dahlin and Sch¨on,2015年)和spsa[Spall,1998年,Ehrlich等人,2015年]进行了比较,以便在ssms中使用合成和真实数据进行推断。

报纸
mingdashike22 在职认证  发表于 2022-5-8 10:15:08
在贝叶斯推理中,pmh被视为后验近似的黄金标准,而spsa被认为是一种高效且可扩展的无梯度优化算法。数值比较表明,gsa可以:(i)提供良好的后验近似,(ii)与pmh相比,将计算时间减少一到两个数量级,(iii)对abc近似和估计中的噪声具有良好的鲁棒性。此外,我们还演示了如何使用所提出的算法来估计金融投资组合的风险。Dahlin和Lindsten[2014]、Gutmannand Corander[2016]和Meeds and Welling[2014]等介绍了与该算法相关的工作。在前两项工作中,作者分别使用gpo获得最大似然估计和map估计。在目前的工作中,我们希望近似整个后验值,而不仅仅是最大化似然值或后验值的参数。此外,与Meeds和Welling[2014]相比,替代函数的不确定性被用来确定下一个对数后验采样点。我们继续第2节,其中概述了所提出的算法及其组件。第3节和第4节讨论了这些组件的细节,第5节介绍了生成的算法。

地板
大多数88 在职认证  发表于 2022-5-8 10:15:12
我们在第6节中对本文进行了广泛的数值评估,在第7.2节中进行了一些评论和未来的工作。我们的目标是找到参数后验(2)bp(θ| y1:T)=N的拉普拉斯近似θ;bθ映射,h-对数p(θ| y1:T)θ=bθ映射|{z},J(bθ映射)i-1., (3) -0.1 0.1 0.2 0.3 0.4 0.5 0.6-44600-44580-44560-44540 mLog后验估计Slog后验估计密度估计-44640-44600-44560-44560-44560-44560-0.000 0.010 0.020 0.030-3-2-10123-44600-44580-44560-44540-44520理论量样本量图1(16)的对数后验(左)样本量相对于u。分布(中心)和qq图(右)的1000个对数后验估计值为(16)。紫色线表示最佳高斯衰减。其中N(θ;u,∑)表示均值为u且协方差矩阵为∑的高斯分布。这里,J(bθMAP)表示在后验模式下评估的对数后验的海森估计,bθMAP=argmaxθ∈Θlog p(θ| y1:T),(4)其中y1:T表示记录的观测值。这可以被视为后验概率模型周围的高斯近似,受伯恩斯坦-冯-米塞斯定理的激励,该定理指出,当T→ ∞. 请注意,即使这是一个渐进结果,它也可以使用帕诺夫和斯波科尼[2015]讨论的有限数量的样本提供合理的近似值。在构造拉普拉斯近似时,我们遇到两个主要问题:(i)在(4)中的优化问题很难有效地解决,(ii)J(bθ映射)通常很难以良好的精度进行估计。第一个问题是由于后验概率的高方差和计算成本。图1的左半部分给出了这个问题的一个例子。

7
能者818 在职认证  发表于 2022-5-8 10:15:15
在这里,我们展示了smc abc在(16)中的u网格上获得的对数后验估计。高方差通常导致spsa和pmh等参数推断算法的收敛速度较慢。使用梯度信息也很难加快收敛速度,因为这需要运行计算复杂的粒子平滑算法。相反,我们建议通过优化平滑的替代函数来避免这些问题,该函数模拟类似于Wood[2010]的对数后验分布。然后,我们可以使用标准优化方法获得拉普拉斯近似值,因为替代函数是平滑的,且计算成本低。代理函数由gpo算法获得,这是贝叶斯优化的一个具体实例[Brochu等人,2010]。代理函数是使用Log Poster中的样本按顺序更新的。在本文中,我们使用高斯过程(gp)的预测分布作为代理函数。因此,我们可以将关于对数后验平滑度的某些先验知识编码到gp先验中,从而减少探索对数后验所需的样本数量。由此产生的gsa算法迭代三个步骤。在第k次迭代中:(i)使用smc abc计算参数θkdenotedξk=log bp(θk | y1:T)处对数后验值的近似值。(ii)利用观测数据{θk,ξk}={θj,ξj}kj=1,通过gp预测后验函数构造替代函数。(iii)评估采集规则以确定θk+1。然后,gpo算法返回后验概率及其不确定性的估计值。与使用样条相比,gps在估计后验密度方面有两个主要优势。

8
可人4 在职认证  发表于 2022-5-8 10:15:18
首先,不确定性量化可用于开发所谓的采集规则,以探索具有较大不确定性的区域,并利用关于后验模态可能位置的信息。这通常会导致算法的快速收敛,从而限制所需的后验样本数,从而降低计算成本。其次,gp可以以自然的方式处理噪声。3估算对数p(θ| y1:T)在本节中,我们将讨论如何估算执行GSA步骤(i)所需的对数后验值。这是通过使用(自举)粒子滤波器来实现的,我们可以从中获得边缘滤波分布pθ(xt | y1:t)的估计值乘以pnθ(dxt | y1:t)=NXi=1w(i)tδx(i)t(dxt),(5),其中x(i)和w(i)t分别表示时间t处的粒子i及其归一化权重。这里,δxdenotes是放置在x的狄拉克测度。正如我们将看到的,粒子系统{w(i)t,x(i)t}Ni=1也可以用来获得对数后验概率的估计。3.1使用ABC进行颗粒过滤应用颗粒过滤器的主要问题是,它假设我们可以逐点计算gθ(yt | xt)。在当前设置中,这是不可能的,相反,我们通过使用abc绕过了对gθ(yt | xt)的计算。这相当于用辅助变量ˇy1:T来增加后验概率,这是从T=1的gθ(yt | xt)模拟的数据,Tabc的基本假设是,从gθ(yt | xt)生成的数据ˇyt应与观测数据类似,前提是正确选择了θ。结果:增强后的后壁可以表达为asp(θ,ˇy1:T | y1:T)=p(θ)pθˇy1:Tρˇy1:T;y1:T,ZΘp(θ)pθˇy1:Tρˇy1:T;y1:T,dθ,式中ρ(u),) 用平均u和公差参数表示一些密度. 该密度用于计算模拟观测值ˇyt和真实观测值yt之间的距离。

9
mingdashike22 在职认证  发表于 2022-5-8 10:15:22
一个常见的选择是高斯密度ρ(u,) = N(u,). 最后,我们假设以下marginalisationproperty holdsp(θ| y1:T)=Zp(θ,ˇy1:T | y1:T)dˇy1:T,当公差参数足够小时,其中p(θ| y1:T)表示扰动模型的后部。因此,当T→ ∞ 和 它足够小了。为了在粒子过滤器中利用这一点,我们使用Jasra等人[2012]中的abc法重新表述了(1)中的ssm。观测数据y1:t受ˇyt=ψ(yt)+zt,zt的扰动~ ρ(0, ), (6) 其中ψ表示某种合适的一对一变换。此外,我们假设可以使用随机变量的变换从模型中进行模拟。这对应于我们可以写出71yt=τθ(71xt),其中τθ表示71x>t=(x>t,v>t)和vt的函数~ 对于某些概率分布νθ。这是一个有用的构造,因为通常可以从复杂的分布生成样本,但不能逐点进行评估。关于如何选择τθ和νθ来生成α-稳定域变量,请参见A。通过这两个步骤,我们可以将ssm(1)重写为| xt | xt-1.~ Ξθ(|xt |xt)-1) =νθ(vt | xt)fθ(xt | xt)-1) ,(7a)ˇyt|xt~ hθ,(ˇyt |ˇxt)=ρˇyt;ψ(τθ(ˇxt)),. (7b)我们现在可以对这个新模型应用算法1中的粒子过滤器,它不需要我们逐点计算gθ(yt | xt),只需要我们可以模拟71yt。在本文中,我们留下了 给用户,这可以通过模拟数据的试运行来实现。然而,适应是可能的 首先,使用Del Moral等人[2012]或Calvet and Czellar[2015]讨论的方法。然而,根据我们的经验,这些方法需要比未调整的smc abcAlgorithm 1更大的N值,通过粒子滤波输入估算对数后验值:ˇy1:T(扰动数据)、ssm(7)、N∈ N(没有。

10
大多数88 在职认证  发表于 2022-5-8 10:15:25
粒子),ρ(abc近似的密度)带有 ∈ R+(公差部分)。输出:对数bpN(θ| |y1:T)(对数后验估计)。注:所有操作均在i,j=1,N.1:样本'x(i)~ μθ(x)νθ(v | x)并设置w(i)=1/N。2:对于t=1到t do3:应用系统重采样,从分类分布中获得祖先指数a(i)t,其中pa(i)t=j= w(j)t-1.4:使用ˇx(i)t传播粒子~ Ξθ|xt|xa(i)tt-1.并设置ˇx(i)0:t=nˇxa(i)t0:t-1,ˇx(i)至。5:通过W(i)t=hθ计算颗粒重量,ˇyt|ˇx(i)tw(i)t=w(i)thPNj=1W(j)ti-1.6:结束7:通过(8)计算对数bpN(θ| |y1:T)。以合理的偏差提供对数后验估计。因此,我们决定 本文给出了计算效率较高的算法。3.2估计量及其统计性质扰动模型(7)对数后验概率的估计量由log bpN(θ| y1:T)=log bpNθ(y1:T)+log p(θ)=TXt=1log(NXi=1W(i)T)给出- T logn+logp(θ),(8),它利用了算法1生成的非标准化权重。据Pitt等人[2012]所知,估计器(8)对有限数量的粒子有偏差,但它是一致且渐近高斯的。具体而言,我们认为对数后验估计中的误差完全符合以下公式给出的clt:√N对数p(θ| y1:T)- 对数bpN(θ| y1:T)+γ(θ)2ND-→ N0, γ(θ), (9) 当N→ ∞ 对于一些未知的方差γ(θ)。因此,我们得到了估计量的偏差表达式,如下所示:-γ(θ)/2N表示一定数量的粒子。然而,根据图1中间和右边的实验数据,我们发现在有限样本情况下,这种模型的误差近似为高斯分布。(8)中的对数后验估计量与扰动模型(7)一致,但与真实模型(1)不一致。Dean和Singh[2011]表明,扰动会导致参数估计的偏差(w.r.t.)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 10:15