楼主: 能者818
1741 41

[量化金融] 基于粒子滤波器的参数学习和变化检测 [推广有奖]

11
能者818 在职认证  发表于 2022-6-10 03:51:34
理论后验值可以写成:p(σt | x1:t)=χn-1.^σtnσt(18) 累积分布函数(CDF):F(σt)=σtZχn-1.^σtnσtdσt(19)见Cochran(1934)3.1.3测量性能在存在理论基准的情况下,粒子过滤器的性能相当于测量两个后验分布之间的距离,即粒子数量的增加和观测数量的增加。KolmogorovSmirnov(KS)统计量测量CDF之间的最大距离,似乎是自然选择,但在文献中并不常用,Djuria和Miguez(2010)提供了与粒子过滤器相关的少数使用示例之一。确定估计的CDF asF*(σt)=XiI(σ(i)t≤ σt)π(i)t。KS统计量测量理论F(σt)和估计后验F之间的最大距离*(σt):KS=supσt | F*(σt)- F(σt)|(20)必须强调的是,由于已知后验概率的可用性,这种方法在这种特定情况下的使用受到限制。在这一限制范围内,这是一种简单有效的方法,用于证明收敛性,以及证明粒子贫化问题;包括Liu和West过滤器解决该问题的能力。3.1.4收敛收敛一直是重要研究的主题,文献中存在广泛的结果。有关详细的理论分析,请参见肖邦(2004)、德尔莫勒尔和杜塞特(2014)、杜克和莫林(2007)以及杜塞特和约翰森(2009)。有关收敛结果的综合调查,请参阅Crisan和Doucet(2002)。本文采用预期收敛结果的数值测试作为评估粒子滤波器性能的一种手段。

12
何人来此 在职认证  发表于 2022-6-10 03:51:37
数值测试基于KS统计量,其基本主张是KS统计量的收敛意味着估计的后验分布收敛于基准分布:supσt | F*(σt)- F(σt)|----→N→∞0 ==> F*(σt)----→N→∞F(σt)(21)此外,KS统计量用于评估观测次数的收敛性,它被证明是粒子过滤器已知问题的有效指标,称为粒子贫化。3.2基本滤波器(SIS)基本滤波算法包括初始化,然后迭代应用(13)中对应的两个步骤。它本质上是对称为序列重要性抽样(SIS)的过滤器的一种调整,用于检测静态参数。动态过滤器见Chen et al.(2003)第26页粒子贫化简介图1:粒子数量增加的KS统计(对数尺度)状态变量还包括从状态变量转换核中提取的数据,见Chen et al.(2003)。更新步骤是计算所有i的^π(i)t+1,归一化步骤获得后验估计π(i)t+1。算法定义如下:1:每个粒子的初始化;绘制N个粒子σ(i)~ U(a,b)和π(i)=N2:按顺序进行每次观测:2.1:更新每个粒子更新权重^π(i)t=π(i)tp(xt | xt-1,σ(i)t)2.2:每个粒子的归一化π(i)t=^π(i)tP^π(i)t通过在给定一组固定观测值的情况下,使用越来越多的粒子重新运行过滤器,并记录每个时间段的KS统计量,对过滤器的性能进行数值测试。结果如图1所示,显示了在对数空间中KS统计量相对于粒子数的值。收敛是明显的,但结果最突出的方面是不稳定性,因为N→ ∞.

13
能者818 在职认证  发表于 2022-6-10 03:51:40
这种不稳定性表明,虽然存在总体收敛趋势,但粒子数的增量增加会导致KS统计中出现显著的噪声。为了更好地理解不稳定性背后的原因,对少量粒子的理论(18)和估计的后验(6)PDF和CDFare进行了目视比较。PDF对比如图2所示。图中的每条垂直线代表一个粒子重量π(i),并在理论后方显示。比例比较表明PDF的估计形状和理论形状之间有很好的对应关系。很明显,估计点分布不均,反映了随机初始化的粒子位置。图3比较了估计CDF和理论CDF。KS Statistics对应于两个图之间的最大垂直距离。直观地看,CDF之间的垂直距离与相邻估计点之间的水平距离有关,CDF中可将其识别为每个分段飞行的终点。注意,估计值和理论后验值以不同的比例显示,因为估计值的比例取决于粒子数,仅收敛到理论后验值的标度为N→ ∞图2:理论(红色,lhs)和估计(黑色,rhs)σ(水平)后验。图3:理论(红色)和估计(黑色)σ(水平)后CDF。间隔因此,最大垂直距离,即KS统计量,与相邻估计点之间的最大距离有关。

14
nandehutu2022 在职认证  发表于 2022-6-10 03:51:44
估计点的随机初始化意味着相邻点之间的最大距离不会随着N单调减少→ ∞, 导致KS统计中观察到的不稳定性。3.3等间距上述推理导致了微不足道的改进:如果点密度位置等间距分布,相邻点之间的最大距离将单调减少→ ∞. 此外,均匀的间距保证了对于任何给定数量的粒子,该最大距离都是最小的。过滤算法中的初始化被改变以反映等间距的估计点:这并不能保证相对于KS统计量的最佳估计点分布,但性能的改善实质上是图4:KS统计量或粒子数量的增加(对数尺度),估计点密度的随机(灰色)与等间距(黑色)分布1:每个粒子的初始化;设σ(i)=(b-a) iNandπ(i)=N2:每个观测的顺序:2.1:每个粒子更新权重^π(i)t=π(i)tp(xt | xt-1,σ(i)t)2.2:每个粒子的归一化π(i)t=^π(i)tP^π(i)t上一节中的收敛性测试将通过上述调整重新运行。如图4所示的结果清楚地表明,这种简单的变化导致了更快、更稳定的收敛速度。10 11改进的原因体现在PDF图5和CDF图6中,并证实了前一节的断言。PDF的形状以等距间隔保留,这使得CDF之间的对齐更加紧密一致,从而消除了KS统计收敛带来的噪声。基本粒子过滤器的一个众所周知的问题是,权重非零的粒子数只能随着每次迭代而减少。

15
能者818 在职认证  发表于 2022-6-10 03:51:47
当特定估计点的估计后验概率低于实施滤波器的计算机可用的最小正浮点数时,就会出现零权重。为了证明这个问题,图7中绘制了零加权粒子的比例与观察值的数量。这种权值退化是一个问题,特别是在检测动态变量时,它本质上减少了样本域。在这种情况下,通过引入重采样步骤,将零重量粒子替换为根据相对估计概率从非零重量粒子中采样,基本上解决了问题。对于静态模型的检测,这在某种程度上与使用准随机而非伪随机绘图的顺序蒙特卡罗研究有关,例如,参见Gerber和Chopin(2015),值得注意的是,对数空间中的收敛是线性的,表明形式为sup | F*(σ) - F(σ)|≤CNEchoging均方误差收敛的理论结果,见Crisan和Doucet(2002),第Vsee Chen等人(2003)第26页中的章节,以获得良好的总结图5:理论(红色,lhs)和估计(黑色,rhs)σ(水平)后等间距估计点图6:等间距估计点的理论(红色)和估计(黑色)σ(水平)后CDF图7:随着SIS过滤器观测次数的增加,零重量粒子的比例记录空间参数,简单地重新采样只会移除零权重粒子,但不能解决样本贫化问题。因为假设模型参数是固定的,所以重采样只是将更多粒子集中在相同(减少)数量的估计点上。

16
kedemingshi 在职认证  发表于 2022-6-10 03:51:50
静态参数问题的解决方案将在下两节中演示。3.4重采样:SIR滤波器减少粒子贫化的第一步是根据当前的后验估计重新分布粒子,这是一种称为样本重要性重采样(SIR)的技术。粒子的这种重新分布复制了概率较高的粒子,并丢弃了任何权重为零或非常低的粒子,从而解决了上一节中强调的问题。文献中提出了各种重采样方法。本文使用了系统重采样,这可以在Hol、Schon和Gustafsson(2006)的调查分析中找到,其中描述为具有最低的差异和降低的计算复杂度,而不会恶化估计。重采样步骤的目标是将由N个不同重量的粒子近似的后验分布转换为由N个相等重量的粒子近似的后验分布。重采样首先生成Nordered数字:uk=(k- 1) +~uN,带▄u~ U[0,1),(22),然后根据σ(k)t=σ(i)t,用i s.t.uk重新选择粒子∈“我-1Xs=1π(s)t,iXs=1π(s)t!(23)调整过滤算法以包括重采样步骤:1:每个粒子的初始化;设σ(i)=(b-a) iNandπ(i)=N2:每个观测的顺序:2.1:每个粒子更新权重^π(i)t=π(i)tp(xt | xt-1,σ(i)t)2.2:每个粒子的归一化π(i)t=π(i)tPπ(i)t2.3:重采样生成一组新粒子:p(σt | x1:t)≈NXi=1δ{σ(i)t=σt}π(i)t------→重采样(σt | x1:t)≈NXk=1Nδ{σ(k)t=σt}如上所述,上述算法丢弃零权重粒子(或者更准确地说,很可能丢弃极低权重的粒子),解决了前一节中提出的问题。

17
可人4 在职认证  发表于 2022-6-10 03:51:53
然而,对于静态模型参数估计,粒子贫化仍然存在,因为重采样只是将粒子集中在相同的估计点上。由于假设参数是固定的,因此它们的值不会改变,因为我们自己的实验证实了这些结果。图8:动态参数SIR滤波器观测值增加的KS统计。随着观测次数的增加,理论后验密度越来越集中在最大似然估计周围,接近狄拉克三角洲测度的极限。理解粒子贫化的关键直觉是,估计的后验概率将在有限次观测后将估计密度集中在一个点上,而不是在限制内:每次更新权重π(i)t时,总权重越来越集中在给定观测值的最大似然参数值θ(i)上,但对于有限数量的观测,最大似然法的参数值不一定与数据生成过程的“真”参数一致,对于有限数量的粒子,通过θ(i)对参数空间进行离散也意味着最佳可能的θ(i)将不与准确的“真”参数一致。因此,在极限范围内,理论和估计的后验值都将集中在不同位置的一个点上,经过一系列观察后,估计值将达到这种状态。一旦估计值达到该点,KS统计值基于一个估计点(表示为σ*) 等于max(1- F(σ*), F(σ*)). 随着理论后验收敛,其PDF变窄,直到单个剩余估计点超出其数值意义域;考虑到这一点,KS统计接近最大值1。

18
nandehutu2022 在职认证  发表于 2022-6-10 03:51:56
如图8所示,通过在大量观测数据上运行粒子过滤器,并在每个序列估计中记录KS统计数据,可以从数值上证明这一点。随着观测次数的增加,KS统计量接近1,这表明理论和粒子滤波后验概率因粒子贫化序列而相互偏离。作为另一种解释,图9显示了粒子过滤器贫困状态的PDF示例,其中后验值仅由四个粒子位置估计。该示例显示了一种状态,即理论后验值在收敛时已缩小,但估计点之间的间距没有改变。这最终将导致通过一个单点来估计后验值,该点最终将超出理论后验值。受粒子贫化问题驱动的众多方法之一,最初提出图9:理论(红色,lhs)和估计(黑色,rhs)σ(水平)后验证明粒子贫化。Gordon等人(1993)提出的方法是在滤波算法的每次操作中向每个粒子添加小的随机扰动,即θt+1=θt+ζt+1(24)ζt+1~ N(0,Wt+1)(25),其中Wt+1是一个特定的方差矩阵。虽然这种方法提供了一个解决粒子贫化问题的框架,但这样做的代价是后验分布的准确性。对固定参数的任何随机扰动都会引入一种特殊的动力学,导致参数估计的潜在过度分散。例如,如果随机扰动的方差Wt+1为常数,则该常数值成为后验估计的最小方差,即在某个点上,最小方差变得大于理论后验方差,几乎正好与粒子贫化相反。

19
nandehutu2022 在职认证  发表于 2022-6-10 03:52:00
因此,希望扰动方差收缩与后验收敛一致,以便它始终只对估计方差作出相对较小的贡献。Liu和West(2001)提出了一种明确解决过度分散的方法,文献称之为Liu和West过滤器。3.5 Liu和West过滤器为了解决过度分散的问题,Liu和West(2001)提出了一种方法,使用Gordon等人(1993)提出的随机扰动的核解释。核表示法的思想是,粒子群中的每个参数都存在一个密度,而不是一个点。通过将核的方差与估计的后验方差联系起来,使其与估计的后验方差的收敛成比例缩小,从而解决过度分散问题。滤波算法的实际应用是在每次迭代时从每个粒子的核密度中提取参数。核表示为正态密度N(σ| m,S),平均值为m,方差为S,并替换方程式(6)中的狄拉克δ密度:p(σt | x1:t)≈NXi=1π(i)tN(σ(i)t | m(i)t,hVt)(26),其中Vt是当前后Vt=NPi(σ(i)t)的方差- σt)和m(i)t=cσ(i)t+(1- c) σt(27)带c=√1.- handσt当前后部的平均值。滤波算法现在包括一个核平滑步骤,其中后验点从等式中定义的核中提取。

20
可人4 在职认证  发表于 2022-6-10 03:52:03
(26):1:每个粒子的初始化;设σ(i)=(b-a) iNandπ(i)=N2:每个观测的顺序:2.1:每个粒子更新权重^π(i)t=π(i)tp(xt | xt-1,σ(i)t)2.2:每个粒子的归一化π(i)t=π(i)tPπ(i)t2.3:重采样生成一组新粒子:p(σt | x1:t)≈NXi=1δ{σ(i)t=σt}π(i)t------→重采样(σt | x1:t)≈NXk=1Nδ{σ(k)t=σt}2.4:每个粒子的核平滑应用σ(i)t~ N(σ(i)t | m(i)t,hVt)数值结果显示了Liu和West过滤器在减少颗粒贫化方面的有效性,如图10所示。随着观测数量的增加,Liu和West滤波器的KS统计数据保持相对恒定,表明滤波器估计与观测数量的收敛性与理论后验值很好地一致。图11所示的估计后验概率与理论概率密度的比较证实了改进的原因。这个例子证明了核函数在估计理论后验值的位置和方差方面的有效性。4参数学习和变化检测在本节中,我们继续扩展粒子滤波器,引入代表本文主要研究贡献的技术。本节首先将regimeshift引入高斯参考模型,以提出更困难的过滤问题,并强调Liu和West过滤器的自适应方面。我们证明了自适应是随机扰动和重新选择相结合的结果,形成了一种能够适应参数变化的遗传算法。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-26 22:39