楼主: 可人4
1571 24

[量化金融] 揭秘卡尔曼滤波器:从直觉到概率图形 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-11 05:22:24
在第3.1小节所述假设下,将预期平方误差最小化的卡尔曼增益定义为误差向量欧几里德(或L)范数的平方,表示真实状态和估计状态之间的误差:xt-^xt |由kt=Pt | t给出-1 HTTS-1t(3.11)它被称为最佳卡尔曼增益。对于任何卡尔曼增益(不一定是最优增益),估计协方差更新如下:Pt | t=(I- KtHt)Pt | t-1(一)- KtHt)T+KtRtKTt(3.12)对于最优卡尔曼滤波器,这将减少到通常的卡尔曼滤波器更新估计协方差,如下所示:Pt | T=(I- KtHt)Pt | t-1(3.13)证明。所有这些公式的推导包括三个步骤。首先,我们推导协方差矩阵的后验估计。然后计算卡尔曼增益作为最小平方误差估计器。第三,我们证明,在最优增益的特殊情况下,更新估计的方程,协方差减少到方程(3.9)中提供的公式。附录A中提供了所有这些步骤,以便顺利阅读本文。Kalman作为图形模型历史上,隐马尔可夫模型(HMM)和Kalman滤波器是在不同且不相关的研究社区中开发的。因此,他们之间的密切关系并不总是得到广泛的重视和赞赏。部分原因还在于,统一这两种方法的一般框架,即图形模型,比HMM和Kalman滤波器来得晚得多。如果没有贝叶斯图形框架,推理计算的两种算法看起来相当不同,也不相关。然而,它们的差异仅仅是离散和连续隐藏变量之间差异的结果,更具体地说,是多项式和正态分布之间差异的结果。

12
何人来此 在职认证  发表于 2022-6-11 05:22:27
这些细节虽然在实践中可能很重要,但不应掩盖这两个模型之间的基本相似性。正如我们将在本节中看到的,状态空间模型(SSM)的参考程序将很快向我们证明,HMM和Kalman filter的模型是近亲,并且共享相同的底层图形模型结构,即隐藏状态空间变量和可观察变量。使用贝叶斯概率图形模型的兴趣是多方面的。首先,它强调了支持HMM和卡尔曼滤波器的通用图形模型体系结构。其次,它提供了MSART通用版本中常用的现代计算工具。2014年10月16日文件:文章\\u KalmanFilterDemystified。tex日期:2018年12月14日。Benhamou/Kalman过滤器让8台机器学习进行推理计算。它展示了如何在非高斯假设的情况下推广卡尔曼滤波器。有趣的是,认识到图形模型是概率论和图论之间的结合。它们为处理应用数学和工程中出现的两个问题提供了一种自然的工具,即不确定性和复杂性,尤其是它们在机器学习算法的设计和分析中发挥着越来越重要的作用。从文献的角度来看,早在Rabiner和Juang(1986)就讨论了隐马尔可夫模型,并在Rabiner(1989)中进行了扩展。概率图模型的第一次时间扩展是由Dean和Kanazawa(1989)提出的,他还创造了动态贝叶斯网络这一术语。在定义基于hiddenMarkov模型或动态贝叶斯网络的各种表示方面已经做了大量工作;这些包括基本框架的概括,或允许更易于处理的推理的特殊情况。

13
何人来此 在职认证  发表于 2022-6-11 05:22:29
例如,混合记忆马尔可夫模型(见Saul和Jordan(1999));可变持续时间HMM(Rabiner(1989))及其扩展分段模型(Ostendorf et al.(1996));阶乘HMMs(Ghahramani和Jordan(1994));和层次HMM(Fine et al.(1998)和Bui et al.(2002))。Smyth et al.(1997)是一篇综述性论文,它清楚地阐述了HMM和DBN之间的联系。Murphy和Paskin(2001)展示了如何将层次HMM简化为DBN,这种连接提供了一种比之前针对这种表示提出的更快的推理算法。Murphy(2002)(最近出版的书Murphy(2013))提供了关于动态贝叶斯网络和相关表示主题的优秀教程,以及尚未出版的Jordan书(2016)4.1。状态空间模型如Murphy(2013)所强调的状态空间模型描述如下:o存在一个由(xt)t=1表示的连续状态链,。。。,n这些是不可观察的,仅在最后实现时才受到过去状态的影响。换句话说,xt是一个马尔可夫过程,意思是P(xt | x,x,…,xt-1) =P(xt | xt-1) 使用图形模型,这也可以表示为某一时间点的给定状态,未来的状态有条件地依赖于过去的状态对于每种状态,我们都可以观察到一个由Zt表示的空间变量,该变量取决于不可观测的空间XT。与卡尔曼滤波模型的原始表示相比,这是非常不同的。我们现在假设存在一个隐藏变量(我们的状态),我们只能测量一个空间变量。从每一步开始,空间变量只依赖于不可观测的,在两个潜在变量水平节点之间只有一个箭头或边。

14
可人4 在职认证  发表于 2022-6-11 05:22:32
该模型在图2中表示为图形模型。显然,图2中提供的图形模型可以承载HMM和卡尔曼滤波模型。为了使我们的模型易于处理,我们需要做出额外的假设。我们将强调HMM和Kalman滤波模型的共同点和不同点。我们施加以下条件:imsart generic ver。2014年10月16日文件:文章\\u KalmanFilterDemystified。tex日期:2018年12月14日。Benhamou/Kalman filter demysti fied 9最新XXXXTZZZZZT观测到。图2:作为贝叶斯概率图形模型的状态空间模型。每个垂直切片代表一个时间步。白色节点表示不可观测或潜在变量,称为状态,用XT表示;灰色节点表示可观测变量,称为空间,用zt表示。Eacharrow表示箭头起始节点和箭头目标节点之间存在关系。点表示有许多时间步。中心点线是为了强调潜在变量和观测变量之间的根本差异o状态和空间之间的关系是线性的(这是我们在卡尔曼滤波器中的测量方程,这是卡尔曼滤波器和HMM模型的共同点):zt=Htxt+vt(4.1),其中假设噪声项vt遵循一个具有零均值的多维正态分布,并且由Rt给出的协方差矩阵。o我们将最简单地选择时间t的状态之间的依赖关系- 假设这是线性的(这是我们的状态方程,这是卡尔曼滤波和HMM模型的共同点),xt=Ftxt-1+Btut+wt(4.2),其中,假设噪声项wt遵循多维正态分布,平均值和协方差矩阵为零,其中Btut是一个附加趋势项(表示我们在卡尔曼滤波器中的控制)。该控制项在HMMmodel中并不常见,但可以轻松添加。

15
nandehutu2022 在职认证  发表于 2022-6-11 05:22:35
这导致了我们将发出信号的略微扩展的公式。这些公式是对文献中常见公式的轻微改进。虽然从理论角度来看,这个控制项似乎是徒劳的,但它在实践中非常重要,在数值应用中也有很大的不同我们将在卡尔曼滤波器部分中假设初始状态和噪声向量在每个步骤x,w,重量,v,VT都是相互独立的(这是HMMand卡尔曼滤波器模型的共同点)。o最后但并非最不重要的一点是,我们假设状态变量XT的分布遵循多维正态分布。这是Kalman滤波器规范。对于HMM,状态假设为服从多项式分布。上述假设将我们的初始状态空间模型限制在一个更窄的类,称为线性高斯SSM(LG-SSM)。该模型已被广泛研究,例如Durbin和Koopman(2012)中可以找到更多的模型。在开始SSM的推理问题之前,有必要检查状态xt的无条件分布。使用方程式(4.2)imsart通用版本。2014年10月16日文件:文章\\u KalmanFilterDemystified。tex日期:2018年12月14日。Benhamou/Kalman滤波器定义了10通过隐式假设空积等于1:tYl=t+1Fl=1,递归计算的x的无条件平均值为:tyk=2Fkx+tXk=2tYl=k+1FlBk(4.3)。在零控制项(Bt=0)的特定情况下,后一个方程简化为tyk=2Fkx(4.4)。无条件协方差的计算如下:Pt=E[xtxtxtt]。使用我们对独立性的假设以及状态方程(4.2),我们可以很容易地将其计算为:Pt=FtPt-1FTt+Qt(4.5)如果控制项不为零,则最后一个方程保持不变,因为控制项是确定的。

16
能者818 在职认证  发表于 2022-6-11 05:22:39
最后一个方程提供了无条件方差的动力学方程,称为李雅普诺夫方程。也很容易检查相邻状态xt和xt+1之间的无条件协方差由Ft+1PTFT+1.4.2给出。推理推理问题在于计算给定输出序列状态的后验概率。此计算可以向前和向后进行。所谓正向,我们的意思是,时间t的干扰信息(称为证据)由时间t之前的部分输出序列组成。向后问题类似,只是证据由时间t之后的部分输出序列组成。使用标准的图形模型术语,我们区分过滤和平滑问题。在过滤过程中,问题是根据部分输出序列z,…,计算状态XT的估计值,zt。也就是说,我们要计算P(xt | z,…,zt)。在HMM模型中,这通常被称为Alpha递归(参见Rabiner和Juang(1986)以及Rabiner(1989))。使用标准卡尔曼滤波符号,我们将用^xt | t,E[xt | z,…,zt](4.6)Pt | t,E[(xt-^xt | t)(xt-^xt | t)t | z,zt](4.7)在此设置下,很容易派生以下属性,该属性在正向递归中提供条件后验分布。为了恢复卡尔曼滤波器的传统结果,我们将时间传播分解为两个步骤:o时间更新:P[xt | z,…,zt]→ P[xt+1 | z,…,zt]imsart通用版本。2014年10月16日文件:文章\\u KalmanFilterDemystified。tex日期:2018年12月14日。Benhamou/Kalman滤波器定义了11xtxt+1ztzt+1xtxt+1ztzt+1(a)(b)图3:(a)测量前的部分状态空间模型,以及(b)测量日期后的部分状态空间模型。

17
可人4 在职认证  发表于 2022-6-11 05:22:42
白色节点是不可观测的变量,而灰色节点是可观测的节点测量更新:P[xt+1 | z,…,zt]→ P【xt+1 | z,…,zt+1】这可以通过下面的图3用图形模型很好地表示。提案2。根据过去的输出z,zt,变量xt+1和zt+1具有联合高斯分布,平均值和协方差矩阵由下式给出:^xt+1 | tHt+1^xt+1 | t和Pt+1 | tPt+1 | tHTt+1 HT+1 Pt+1 | tHt+1 Pt+1 | tHTt+1+Rt+1(4.8)证明。这很简单,因为所考虑的状态空间模型是线性高斯状态空间模型(LGSSM)。尽管看起来很简单,但前面的命题使我们的图形模型成为一个完整的动力库,因为它提供了开始推理的构建块。事实上,了解图3步骤(a)的条件后验分布,我们就可以得出步骤(b)的第一个结论。此外,利用因子分析图形模型等更简单图形模型的结果,我们可以立即得出结论,第二步如命题3所示。根据过去的输出z,zt+1,我们有以下关系:xt+1 | t+1=xt+1 | t+Pt+1 | tHTt+1Ht+1Pt+1 | tHTt+1+Rt+1-1(zt+1- Ht+1^xt+1 | t)(4.9)Pt+1 | t+1=Pt+1 | t- Pt+1 | tHTt+1Ht+1Pt+1 | tHTt+1+Rt+1-1Ht+1Pt+1 | t(4.10)证明。这是空间模型的直接结果,可以在Murphy(2013)或Jordan(2016)中找到。我们在附录B中提供了一个自包含的证明,总结了所有这些结果,得出了第3节中提供的卡尔曼滤波器的开创性递归,并由以下命题给出。imsart通用版本。2014年10月16日文件:文章\\u KalmanFilterDemystified。tex日期:2018年12月14日。Benhamou/Kalman过滤器揭开了12个命题4的神秘面纱。

18
可人4 在职认证  发表于 2022-6-11 05:22:45
卡尔曼滤波器由以下递归方程组成:^xt | t-1=Ft^xt-1吨-1+Btut(4.11)Pt | t-1=FtPt-1吨-1FTt+Qt(4.12)^xt+1 | t+1=^xt+1 | t+Pt+1 | tHTt+1Ht+1Pt+1 | tHTt+1+Rt+1-1(zt+1- Ht+1^xt+1 | t)(4.13)Pt+1 | t+1=Pt+1 | t- Pt+1 | tHTt+1Ht+1Pt+1 | tHTt+1+Rt+1-1Ht+1Pt+1 | t(4.14)证明。这是命题3的一个微不足道的结果。方程式(4.11)(第4.12条)与(3.3)(第3.4条)中提供的方程式相同,但使用图形模型归纳法。备注4.1。如果我们引入第3节中已经提供的以下中间变量:▄yt+1=zt+1- Ht+1^xt+1 | t(4.15)St+1=Rt+1+Ht+1Pt+1 | tHTt+1(4.16)Kt+1=Pt+1 | tHTt+1S-1t+1(4.17)将方程式(4.13)和(4.14)转换为方程式^xt+1 | t+1=^xt+1 | t+Kt+1yt+1(4.18)Pt+1 | t+1=(I- Kt+1Ht+1)Pt+1 | t(4.19),即方程式(3.8)和(3.9)。这证明了使用图形模型和控制理论的推导在数学上是等价的!备注4.2。在这一阶段,除了我们用图形模型展示了卡尔曼滤波递归之外,没有什么新的想法。我们可以更快、更容易、更直观地检查这一点。值得注意的是,我们还有多种方法来编写增益矩阵。使用ShermanMorrisonWoodbury公式,我们还可以导出增益矩阵的各种形式,如下所示:Kt+1=Pt+1 | tHTt+1Ht+1Pt+1 | tHTt+1+Rt+1-1(4.20)=P-1t+1 | t+HTt+1Rt+1Ht+1-1HTt+1R-1t+1(4.21)=Pt+1 | t- Pt+1 | tHTt+1(Ht+1Pt+1 | tHTt+1+Rt+1)-1Ht+1Pt+1 | tHTt+1R-1t+1(4.22)=Pt+1 | t+1HTt+1R-1t+1(4.23)当简化形式(最后一个等式)在数值上不稳定时,这些形式可能有用。方程式(4.23)很有用,因为它将Kt+1与Pt+1 | t+1联系起来。有趣的是,注意到Kalman gainKt+1=Pt+1 | tHTt+1S的两种形式-1t+1=Pt+1 | t+1HTt+1R-1t+1IMart通用版本。2014年10月16日文件:文章\\u KalmanFilterDemystified。tex日期:2018年12月14日。Benhamou/Kalman滤波器释义13备注4.3。

19
mingdashike22 在职认证  发表于 2022-6-11 05:22:48
卡尔曼滤波器引起了一些评论。我们首先可以注意到,卡尔曼滤波方程可以有不同的解释。结合方程式(3.8)和(3.3),我们检索到如下错误校正算法:^xt | t=Ft^xt-1吨-1+Btut+Ktzt公司- Ht(Ft^xt-1吨-1+Btut)或等效地,重新组合术语^xt-1吨-1^xt | t=(英尺- KtHtFt)^xt-1吨-1+(Btut+Kt(zt- 这向我们展示了两件事:oKalman滤波器可以看作是Ornstein-Uhlenbeck过程的离散版本oKalman滤波器可以看作是离散时间内的自回归过程,因为递归方程在递归最小二乘(RLS)估计中也出现类似的情况,我们在这里也看到了与RLS的联系。令人惊讶的是,这些联系并不经常建立,主要是因为卡尔曼滤波器最初是一个控制问题,而不是统计学家的问题。尽管卡尔曼滤波方程看起来很好,但它们有一个主要问题。这是过滤器的数值稳定性。如果过程噪声协方差qt很小,则舍入误差将导致在数值上获得该矩阵小正特征值的负值。由于该模式将传播四舍五入误差,状态协方差矩阵Pt将逐渐成为唯一的正半定义(因此不确定),而理论上它是一个完全可逆的真正正定义矩阵。为了保持正定义特性,我们可以稍微修改递归方程,以找到保留两个协方差矩阵正定义特征的递归方程。由于任何正定义矩阵Sd都可以用其上三角平方根矩阵R来表示和重构,且Sd=RtRT,这种形式的表示将保证生成的矩阵永远不会得到负特征值,因此值得使用平方根表示的平方根格式。

20
nandehutu2022 在职认证  发表于 2022-6-11 05:22:51
或者,我们也可以使用所谓的单位对角线(U-D)分解形式表示协方差矩阵,其中,U’是单位三角形矩阵(单位对角线),D’是对角线矩阵。这种形式特别避免了矩阵平方根表示所需的许多平方根运算。此外,在比较这两种方法时,U-D形式具有优雅的特性,需要相同的存储量,并且计算量略少。这就解释了为什么Thornton(1976)更喜欢U-D工厂化。一个微小的变化是Innovation协方差矩阵的LDL分解。LDL分解依赖于将协方差矩阵SDW分解为两个矩阵:下单位三角形(单位三角形)矩阵L和对角矩阵D。该算法从线性代数包(LAPACK)中实现的LU分解开始,并进一步将其分解为LDL形式。任何奇异协方差矩阵都是旋转的,因此第一个对角线划分总是非奇异且条件良好(有关更多详细信息,请参阅Bar Shalom et al.(2002))。4.3. 与信息过滤器的联系值得展示与粒子和信息过滤器的密切联系。这是一个直接的结果,即多元高斯函数属于指数族,因此属于正则参数。因此,我们可以用后者来重写过滤器,而不是用他们的MSart通用版本。2014年10月16日文件:文章\\u KalmanFilterDemystified。tex日期:2018年12月14日。Benhamou/Kalman滤波器解释了14力矩参数的初始使用。这是对卡尔曼滤波器的有趣重写,因为它使SIT在数值上更加稳定。用∧和η表示的多变量高斯分布的正则参数由矩参数∑和u获得,如下所示:∧=∑-1和η=∑-1u.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:07