楼主: 能者818
1158 23

[量化金融] 基于离散小波变换的精确和近似隐马尔可夫链滤波器 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-7 02:54:50
由于这种方法依赖于一种通常无效的假设,因此不可能证明这种近似模式的任何收敛性。或者,(ξt)可以通过使用Milstein格式的离散过程来近似,以便数值求解(2.7)中的SDE:^ξn+1=hI+(Q-D) h+D(I+D)(Ztn+1)- Ztn)i^ξn.(4.2)这里的^ξn:=^ξtn,其中tn=nh与之前一样。我们再次看到,这个近似只涉及(Ztn+1)-Ztn),这也可以在我们的情况下观察到,因此近似滤波器也可以在离散设置中使用。对于(4.2),已知如果离散化的时间步长趋于零,则由^ξn得到的连续近似^ξ以强阶1收敛于(2.7)的真解。此外,这种收敛也适用于相应的滤波器(见[23]定理4.1)。因此,对于频繁的观测,我们认为(4.2)中的近似值在我们的环境中适用。然而,请注意,(4.2)的实际实现需要一些平滑处理,以避免像^ξngetting negative这样的影响。4.2. 通过PDE的方法我们推导出了过滤器(2.4)中出现的密度GIJ的PDE系统。从GIJWE获得密度giby(2.5)。一旦涉及到连续时间马尔可夫链,它就是处理微分方程的常用工具,例如,马尔可夫链概率分布的常微分方程组(2.1)或电图过程给出的粒子位置的偏微分方程,参见[18]。这个方程是一个双曲二阶微分方程,被称为电报(或阻尼波)方程。

12
何人来此 在职认证  发表于 2022-5-7 02:54:54
文献[21]推导了不对称情况下电报过程密度的偏微分方程。以下是i,j的定义∈ E、 x∈ R和t≥ 0分布j(x,t)=Pi(Jt≤ x、 εt=j)(4.3)和相应的密度乘以fij(x,t)。用fij(x,t)表示P(Jt)的密度≤ x |ε=i,εt=j)。因此,我们显然有以下关系:~fij(x,t)=fij(x,t)pij(t)。(4.4)根据FIJ,我们可以使用(2.3)通过卷积立即计算过滤器所需的密度GIJ。注意,密度fii(x,t)在x=α处有一个原子,其大小为e-qitwhere qi=-qii,自从-qitno开关发生在时间间隔[0,t]内,在这种情况下,Jt=αit。现在,我们将根据第一个时间间隔[0,h]中发生的情况,推导出一个﹪fijby条件的偏微分方程。我们得到了fij(x,t)=(1)- qih+o(h))Fij(x- αih,t- h) +ZhXk6=jqie-qispikFik(x)- α是,t- s) ds+o(h),其中pikis是由pik=qikqi给出的嵌入马尔可夫链的转移概率,对于i6=k。重新排列项并除以h得到:h(Fij(x,t)- Fij(x)- αih,t))+h(Fij(x- αih,t)- Fij(x)- αih,t- h) )=-qiFij(x,t)+hZhXk6=iqie-qispikFik(x)- α是,t- s) ds+o(h)h↓ 我们得到0(请注意,右侧存在极限,因此左侧也存在极限):αixFij(x,t)+tFij(x,t)=XkqikFkj(x,t)。应用运算符xon两边,我们推导出密度的以下方程:αixfij(x,t)+tfij(x,t)=Xkqikfkj(x,t)。以矩阵形式,这个方程可以写成dαxG(x,t)+tG(x,t)=QG(x,t)(4.5),其中G=(~fij)i,j∈Eand和α是α,…,的对角矩阵,α非对角线。此外,我们还得到了边界条件fij(x,0)=δij。这个偏微分方程组可以用数值方法求解。~fij(x,t)的域由x给出∈ [miniαit,maxiαit]和t>0。

13
nandehutu2022 在职认证  发表于 2022-5-7 02:54:57
在外面,密度消失了。这种方法是精确的,但是需要进行数值计算。其中一个难点是出现的问题。然而,点质量是已知的,可以分离。更准确地说,我们知道∧fii(x,t)=Δαit(x)e-qit+^fii(t,x),其中^f是光滑的。4.3. 通过离散化的方法在这里,我们通过离散连续时间马尔可夫链,对过滤器中涉及的密度进行非常简单的近似。更准确地说,当我们考虑(εm·t) 姆威思t=h/N,然后我们得到一个带有转移矩阵p的离散时间马尔可夫链(t) =eQt、 注意,对于i6=j eitherpij(t)≡ 0或pij(t)>0表示所有t>0。我们假设后一种情况对所有i6=j都有效。我们现在可以用^Jh:=tNXm=1αεm·t、 由于E是有限的,随机变量^jh显然是离散的,只能取有限个值。我们用D表示所有可能值的有限集合。此外,我们表示一个多索引jas a向量j=(j,…,jN),其中每个jk∈ E、 即j∈ EN对于d∈ D表示∧(D):={j∈ EN:αj+…+αjN=d/t} 。然后我们得到Pi(^Jh=d)=PiNXm=1αεm·t=d/T=Xj∈∧(d)π(ε)t=j)N-1Yk=1P(ε(k+1)t=jk+1 |εkt=jk)。因此,我们可以通过^gi(z,h)=Xd来近似Zhgivenε=i分布的密度gi(z,h)∈DPi(^Jh=d)φσ√h(z)- d) 。(4.6)类似地,对于固定i,j∈ d和E∈ D表示∧(j,D):={j∈ EN-1:αj+…+αjN-1=d/T- αj}。然后我们得到Pi(^Jh=d |εh=j)=PiN-1Xm=1αεm·t=d/T- αjεh=j=Xj∈∧(j,d)Pi(ε)t=j)π(εh=j)N-2Yk=1P(ε(k+1)t=jk+1 |εkt=jk)·P(εh=j |ε(N)-1)t=jN-1).因此,我们可以通过^gij(z,h)=Xd来近似Zhgivenε=i,εh=j分布的密度gij(z,h)∈DPi,j(^Jh=d)φσ√h(z)- d) 。(4.7)很明显,在这种方法中,如果T→ 0.5.

14
mingdashike22 在职认证  发表于 2022-5-7 02:55:00
数值例子这一部分用一些数值例子说明了这项工作的结果。基本上,我们考虑两种情况。首先,我们评估了一个潜在的连续时间马尔可夫链有两种状态的场景,以便提供一个比较精确滤波和近似的例子。其次,我们考虑一个五州的案例。对于连续滤波器(4.1)的应用,重要的是要记住,诱导的近似误差不仅源于我们有离散测量的事实,还源于所考虑的矩阵D和Q不相互转换的事实。所有示例都是在配备Intel i7-2620M CPU和8GB RAM的笔记本电脑上使用Matlab R2014a实现的。PDEs(4.5)系统采用[30]提出的算法求解,该算法直接在Matlab中实现。根据解fij,我们使用(4.4)推导出fij(x,t),然后执行数值卷积程序,以获得网格点上的密度gij(x,t)值,并使用(2.5)获得gi(x,t)。三次插值用于评估其他点的密度。5.1. 两种状态我们考虑的情况是α=-3,α=1,σ=1,连续时间马尔可夫链的初始分布p=(0.1,0.9),强度矩阵xq=-2 23 -3..过滤时间精确248.53PDE基于3.32离散化4.73准精确0.18(a)两种状态示例过滤时间精确PDE基于4.99离散化171.48准精确0.23(b)五种状态示例1:每个过滤步骤的计算时间= 1(左)和= 2(右)。在图1中,我们展示了ZT的密度取决于. 在图2中,我们展示了两种情况下的ZT密度,和t、 可以看出,对密度对形状的影响。

15
可人4 在职认证  发表于 2022-5-7 02:55:03
为了评估过滤器,使用100个离散点和每个时间步50个观察值生成观察过程。过程及其观察结果如图3所示。在图4中,我们根据真实状态的期望值显示了过滤结果。这是两种情况下的情况。在第一种情况下,使用每个测量值。在第二种情况下,仅使用每五分之一的测量值。正如预期的那样,在基础状态发生变化后,更频繁的测量会导致更快的估计收敛。另一方面,观测次数较少的滤波器对观测误差不太敏感。确切的过滤器与基于PDE的方法几乎无法区分。基于时间离散化的过滤器假设马尔可夫过程在每次测量之间最多执行一次跳跃,即我们使用N=1。过滤器的计算时间如表1所示。精确过滤器的高计算时间是因为需要在每个过滤器步骤中执行数值积分。基于偏微分方程的滤波器的数量不包括数值求解偏微分方程所需的时间,因为得到的解在每个滤波器步骤中都会重复使用,因此,对平均计算时间的影响取决于执行的滤波器步骤的数量。偏微分方程在等距网格上求解[-5,5]包括[0,1]上2000个等距分布时间点的3000个离散点。(a) ε=1,εt=1(b)ε=1,εt=2(c)ε=2,εt=1(d)ε=2,εt=2图2:以ε和εt.0.2 0.4 0.6 0.8 1.2为条件的Zt密度-5.-4.-3.-2.-101布朗运动。

16
何人来此 在职认证  发表于 2022-5-7 02:55:06
CTMCTrue过程测量图3:观察到的过程及其组件(两状态情况)。0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2-3.-2.5-2.-1.5-1.-0.500.51接地电流XACT滤波器准-精确过滤器基于过滤器的分离过滤器(a)每次测量使用0.20.40.6 0.8 1 1.2 1.4 1.6 1.8 2-3.-2.5-2.-1.5-1.-0.500.51接地电流XACT滤波器准-精确过滤器基于过滤器的离散过滤器(b)每使用一次测量图4:CTMC的真实状态及其估计值(2状态情况)。5.2。现在,我们来看一个更复杂的例子,其中αi(对于i=1,…,5)由这些值给出-3.-分别为1、0、1、2。此外,我们使用了p=(0.1,0.3,0.3,0.2,0.1)和Q=-1 0.5 0.3 0.1 0.10.4 -1 0.3 0.1 0.20.1 0.1 -1 0.4 0.40.1 0.1 0.3 -1 0.50.1 0.1 0.3 0.5 -1.作为初始分布和强度矩阵。本例中考虑了两个不同的扩散参数σ=1和σ=2,以观察σ对过滤器质量的影响。这一次,我们模拟了5个时间步,每个时间步有50个离散点和10个观测值。真实过程如图5所示。过滤结果如图6所示(再次显示所获得分布的期望值)。对于大量测量,基于偏微分方程的过滤器几乎无法与离散化过滤器(此处使用4个离散化单元,即N=4)区分。这是因为基于偏微分方程的方法得到了精确的密度,而精确的密度只会被解偏微分方程时产生的数值误差和计算密度时产生的插值误差所破坏。显然,随着测量频率的增加,两次连续测量之间的预期跳跃次数减少。

17
kedemingshi 在职认证  发表于 2022-5-7 02:55:10
因此,在所考虑的情况下,当使用每个测量值时,从离散方法获得的密度可以很好地近似于精确密度。这种近似质量不取决于扩散参数σ。然而,σ越大,所有过滤方法之间的差异就越不明显,因为可以获得的关于连续时间马尔可夫链基本真实状态的信息就越少。查看表1中的计算时间,与两种状态的情况相比,这一次的情况有所不同。再一次,我们仅使用每个测量值和σ=1来显示运行的计算时间(对于其他运行而言,这没有显著差异)。这一次,离散化滤波器需要大量的计算时间。这是由于其递归实现和使用了更多的离散化单元。然而,这也可以通过在实际过滤器运行之前获得集合D和密度^gi(z,h)和^gij(z,h)(分别根据(4.6)和(4.7))来优化。在这种情况下,这些密度的计算归结为计算高斯混合密度。6.结论在本文中,我们考虑了一个隐马尔可夫模型,其中积分连续时间马尔可夫链可以在受布朗运动扰动的离散时间点上观察到。利用非对称电报过程的最新结果,我们推导出了基础连续时间马尔可夫链的滤波器的精确公式,因为该链只有两种不同的状态。对于更多状态,我们提出了三种近似算法来数值计算滤波器。

18
nandehutu2022 在职认证  发表于 2022-5-7 02:55:13
我们通过两个例子研究了这些过滤器的性能:一个是两种状态,另一个是五种状态。例如,当我们必须从观察到的资产价格中过滤出潜在的经济状态时,就会出现这样的问题。AcknpWLedgment我们要感谢我们的学生Fehmi Mabrouk在他的毕业论文中就这个主题所做的一些初步工作,这鼓励我们进一步研究这个主题。0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5-1012345布朗运动。CTMCTrue ProcessMeasurements(a)σ=10 0.5 1 1.5 2 2.5 3.5 4.5 5 5-10123456布朗运动。CTMCTrue ProcessMeasurements(b)σ=2图5:观察到的过程及其组件(5状态情况)。0.5 1 1.5 2.5 3 3.5 4.5 5 5-3.-2.-1012地面实况-精确过滤器基于分离过滤器的过滤器(a)σ=1,每次测量使用0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5-3.-2.-1012地面实况-精确过滤器基于过滤器的离散过滤器(b)σ=2,每次测量使用0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5-3.-2.-1012地面实况-基于过滤的精确测量值d0.5过滤1.5-3.-2.-1012地面实况-精确过滤器基于过滤器的离散过滤器(d)σ=2,每使用一次测量图6:CTMC的真实状态及其估计值(5状态情况)。附录定理3.1的证明:积分电报过程的密度在[7]:P(Ih)中给出∈ dx)/dx=e-λhδh(x)+qh,λ(x),其中δh(x)是点h和qh的狄拉克测度,λ(x)=λe-λhhBλp(h)- 十)+h+xh- 十、Bλp(h)- 十)i、 x∈ [-h、 h]修改后的贝塞尔函数已在(3.6)中定义。

19
大多数88 在职认证  发表于 2022-5-7 02:55:16
Jh的密度ε=i由密度变换公式(Jh)确定∈ dx)/dx=e-λhδh(a+bi)(x)+|bi | qh,λ十、- 阿比.最后,通过卷积公式gi(z,h)=e得到给定ε=i的Zh=Jh+σwh的密度-λhφσ√h(z)- h(bi+a))+|bi | Zh(a+|bi |)h(a)-|bi |)φσ√h(z)- x) qh,λ十、- 阿比dx。因此,定理3.1的第一部分被显示出来。接下来,我们确定给定Nhis偶数的密度。根据这一点,我们可以在前面的计算中计算GIIA。首先要注意的是∈ dx | Nh∈ 2N)/dx=P(Ih)∈ 新罕布什尔州dx∈ 2N)/dxP(Nh)∈ 2N)=P∞k=0P(Ih)∈ dx,Nh=2k)/dxP(Nh∈ 2N)=∞Xk=0P(Ih)∈ dx | Nh=2k)/dxP(Nh=2k)P(Nh)∈ 2N)。为了k≥ 1给定的IHNH密度=2k isP(Ih∈ dx | Nh=2k)/dx=(2k)!(k)- 1)!K(h)- x) k-1h+x(2t)2k,x∈ [-h、 h],见[7]中的引理A.1。此外,我们还有p(Nh=2k)=e-λh(λh)2k(2k)!P(Nh)∈ 2N)=∞Xk=0e-λh(λh)2k(2k)!=E-λhcosh(λh)。当k=0时,给定Nh=0时,h上的点质量为1,即P(Ih∈ dx | Nh=0)/dx=δh(x)和P(Nh=0)=e-λh.我们总共得到:P(Ih)∈ dx | Nh∈ 2N)/dx=δh(x)cosh(λh)-1+∞Xk=1P(Ih)∈ dx | Nh=2k)/dx(λh)2k(2k)!cosh(λh)=cosh(λh)-1δh(x)+qh,+(x),其中qh,+(x)=cosh(λh)-1λh+xh- 十、Bp(h)- x) λ, 十、∈ [-h、 h]。接下来我们确定密度qh,-(x) 当然,这很奇怪。为了k≥ 1 IhgivenNh的密度=2k+1 isP(Ih∈ dx | Nh=2k+1)/dx=(2k+1)!(k!)(h)- x) k(2h)2k+1,x∈ [-h、 h],见[7]中的引理A.1。

20
nandehutu2022 在职认证  发表于 2022-5-7 02:55:19
此外,我们还有p(Nh=2k+1)=e-λh(λh)2k+1(2k+1)!P(Nh)∈ 2N+1)=∞Xk=0e-λh(λh)2k+1(2k+1)!=E-λhsinh(λh)。我们总共得到:qh,-(十)=∞Xk=0P(Ih)∈ dx | Nh=2k+1)/dx(λh)2k+1(2k+1)!sinh(λh)=sinh(λh)-1λBp(h)- x) λ, 十、∈ [-h、 h]。因此,给定ε=εh=i的密度再次通过密度变换公式(Jh)获得∈ dx |ε=εh=i)/dx=cosh(λh)-1δh(a+bi)(x)+| bi | qh+十、- 阿比,最后是Zh=Jh+σwh的密度,给定ε=εh=i isgii(z,h)=φσ√h(z)- h(bi+a))cosh(λh)-1+| bi | Zh(a+| bi |)h(a)-|bi |)φσ√h(z)- x) qh+十、- 阿比dx。类似地,我们得到了给定ε=i,εh=j的密度,其中i6=j byP(Jh∈ dx |ε=i,εh=j)/dx=|bi | qh,-十、- 阿比Zhgiven的密度ε=i,εh=j isgij(z,h)=| bi | Zh(a+| bi |)h(a-|bi |)φσ√h(z)- x) qh,-十、- 阿比dx,z∈ R.定理3.2的证明:给定ε=1的非对称电报过程的密度符合[21]P(Ih∈ dx)/dx=e-λhδh(x)+ph(x),其中δh(x)是h点的狄拉克量度,ph(x)=λexp- λx+h)- λH- 十、·血红蛋白pλ(h)- 十)+(h+x)λ(h)- x) λBpλ(h)- 十)i、 x∈ [-h、 h]。由此可知,Zhgivenε=1的密度与之前的证明一致。接下来我们要确定Zhgivenε=εh=1的密度。注意,我们首先有:g(z,h)=P(Zh∈ dx |ε=εh=1)/dx=P(Zh)∈ dx,εh=1 |ε=1)/dxP(εh=1 |ε=1)。从(3.7)我们得到p(εh=1 |ε=1)=p(h)=λ+λ+λ+λe-(λ+λ)t.根据[21]中的结果,我们可以导出P(Ih)∈ dx,εh=1 |ε=1)/dx。我们有∈ dx,εh=1 |ε=1)/dx=e-λhδh(x)+qh,+,1(x),其中qh,+,1(x)=exp- λx+h)- λH- 十、·hpλh+xh- 十、Bpλ(h)- 十)i、 x∈ [-h、 h]。密度g(z,h)随后加入结果。我们对Zhgivenε=1,εh=2的密度进行了类似的计算。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 11:13