楼主: kedemingshi
895 48

[量化金融] 跳跃扩散的最优迭代阈值核估计 [推广有奖]

31
kedemingshi 在职认证  发表于 2022-6-11 04:06:15 |只看作者 |坛友微信交流群
λ=1000和θ=0.01,这使得年化波动率约为0.04+1000(0.01)≈ 0.37.选择这些λ的原因是为了研究跳跃强度水平对估计器性能的影响程度,同时相应地选择θ,以便年化波动率是合理的。我们假设一年有252个交易日,每天有6.5个交易小时。我们关注5分钟数据,这是文献中的标准数据,以避免微观结构噪声影响。此外,数据长度设置为1个月(21个交易日)、3个月(63个交易日)和1/2年。5.1不同阈值的比较我们现在开始研究第4节中介绍的不同“最佳”阈值近似方法如何影响跳跃错误分类的数量。

使用道具

32
何人来此 在职认证  发表于 2022-6-11 04:06:19 |只看作者 |坛友微信交流群
在表1中,我们报告了与四种阈值近似方法Bc1、Bc2、BN1和Bn2以及Obs相对应的跳跃错误分类的平均总数/Hrρλsd(f)(R)Lc1'Lc2'Ln1'Ln2'L*221 12 0 50 0.03 0.848 0.864 0.835 0.795 0.67821 12 -0.5 50 0.03 0.844 0.884 0.856 0.829 0.69021 12 0 100 0.03 1.669 1.591 1.623 1.382 1.25921 12 -0.5 100 0.03 1.628 1.643 1.584 1.381 1.27221 12 0 200 0.03 3.384 2.967 3.318 2.603 2.52921 12 -0.5 200 0.03 3.372 2.882 3.284 2.577 2.48721 12 0 1000 0.01 51.301 32.673 49.700 31.087 30.21821 12 -0.5 1000 0.01 51.547 32.937 49.895 31.361 30.48063 12 0 50 0.03 2.660 4.217 2.531 2.174 2.09863 12 -0.5 50 0.03 2.590 4.137 2.466 2.125 2.05163 12 0 100 0.03 4.952 6.688 4.741 3.876 3.73963 12 -0.5 100 0.03 4.914 6.822 4.737 3.937 3.82063 12 0 200 0.03 10.195 11.518 9.842 7.651 7.49163 12 -0.5 200 0.03 10.001 11.144 9.658 7.515 7.33963 12 0 1000 0.01 148.661 107.325 143.339 89.477 87.43463 12 -0.5 1000 0.01 149.923 107.895 144.979 90.393 88.293126 12 -0.5 100 0.03 10.106 18.243 9.636 7.890 7.624126 12-0.5 200 0.03 20.129 27.433 19.353 15.036 14.605126 12-0.5 1000 0.01 298.656 241.770 285.045 177.588 173.745表1:基于1000个样本的正常跳跃错误分类的平均总数。oracle阈值,其中我们使用二阶近似B*2In(40),所有真实参数值均已插入。在每种情况下,我们计算跳跃错误分类的平均数量:(R)La:=mmXj=1nXi=1{| X(j)ti-X(j)ti-1 |>Bai,j,N(j)ti-N(j)ti-1=0}+nXi=1{| X(j)ti-X(j)ti-1|≤Bai,j,N(j)ti-N(j)ti-16=0}!, (49)其中m是模拟次数,X(j)·和N(j)分别是X和N的第j条模拟路径,且∈ {c1、c2、n1、n2,*2} ,具体取决于使用的阈值方法。

使用道具

33
mingdashike22 在职认证  发表于 2022-6-11 04:06:22 |只看作者 |坛友微信交流群
对于非常数方法,我们使用指数核K(x)=e-|x |/2来估计即期波动率,如定理3.6所示,这是最优的。Weran只对第4节中描述的迭代算法进行了4次迭代。如下所示,这通常有助于实现收敛。结论是,在所有四种方法中,基于二阶近似和非恒定熵估计的跳跃检测方法(“n2”方法)表现最好。虽然,正如应该预料的那样,这比甲骨文略差,但它与甲骨文非常接近。即使对于λ=50的相对较低值,由于跳数相对较少,通常很难估计λ和C(f),二阶局部方法仍然比基于恒定阈值的方法要好一些。例如,对于1个月的时间范围,then2方法在该月的预期4次跳转中只遗漏了约1次跳转。随着跳跃强度的增加,恒定阈值和局部阈值之间的差异变得更加重要。对于200的强度,该方法只会错过预期的16次跳跃中的3次。如上所述,表1的结果基于第4节算法的4次迭代。为了评估算法的收敛性,在表2中,我们显示了基于二阶近似的算法3的前4次迭代中每一次的平均跳跃错误分类数的结果,如(49)所述。

使用道具

34
mingdashike22 在职认证  发表于 2022-6-11 04:06:25 |只看作者 |坛友微信交流群
可以看出,通常在第二次迭代后达到收敛#of天#Obs/Hrρλsd(f)Ln2,Iter1 Ln2,Iter2 Ln2,Iter3 Ln2,Iter421 12 0 50 0.03 0.795 0.795 0.79521 12-0.5 50 0.03 0.830 0.829 0.82921 12 0 100 0.03 1.383 1.382 1.38221 12-0.5 100 0.03 1.384 1.382 1.381 1.38121 12 0 200 0.03 2.602 2.603 2.60321 12-0.5 200 0.03 2.586 2.577 2.57721 12 0 1000 0.01 31.855 31.216 31.121 31.08721 12-0.5 1000 0.01 32.080 31.482 31.385 31.36163 12 0 50 0.03 2.183 2.174 2.17463 12-0.5 500.03 2.126 2.125 2.125 2.12563 12 0 100 0.03 3.875 3.874 3.876 3.87663 12 -0.5 100 0.03 3.952 3.938 3.937 3.93763 12 0 200 0.03 7.680 7.653 7.651 7.65163 12 -0.5 200 0.03 7.544 7.517 7.515 7.51563 12 0 1000 0.01 91.283 89.747 89.526 89.47763 12 -0.5 1000 0.01 92.324 90.722 90.411 90.393126 12 -0.5 100 0.03 7.929 7.892 7.889 7.890126 12 -0.5 200 0.03 15.097 15.036 15.035 15.036126 12 -0.5 1000 0.01 181.403 178.022 177.677 177.588表2:基于二阶近似的非齐次算法3前4次迭代的跳跃错误分类平均总数。同样,我们对T的所有值使用1000个样本。5.2原点跳跃密度和现货波动率的估计我们现在研究第2.4节提出的原点跳跃密度核估计量的性能。由于我们已经证实,具有非恒定波动率估计的最佳阈值的二阶近似值优于其他阈值,因此我们将仅在本小节和后续小节中考虑该阈值。结果如表3所示。这些基本上证实了我们的预期,即估计器的性能随着时间范围和强度的增大而提高(对于相同水平的跳跃方差)。

使用道具

35
kedemingshi 在职认证  发表于 2022-6-11 04:06:28 |只看作者 |坛友微信交流群
很难将θ=0.03时的估计器性能与θ=0.01和λ=1000时的估计器性能进行比较,因为尽管我们预计后一种情况下会出现更多跳变,但由于θ较小,这些估计器也更难检测到。最后,一个有趣的现象是,我们通常低估了原点处的跳跃密度。这对我们来说是可以接受的。事实上,如果我们将cB表示为估计的二阶阈值,我们通常会得到B>cB>B。这比cB<B要好,在这种情况下,我们可能会明显避免误报(即,将连续分量的增量误分类为跳跃)。最后,我们给出了一些关于核/阈值现货波动率估值器性能的说明(44)。基于最优阈值的二阶近似,我们对局部算法3进行了4次迭代。在图1中,我们展示了方差过程{Vt}t的原型实现≥0在(46)中定义,以及第1次迭代(红色虚线)、第4次迭代(蓝色长虚线)和oracle(绿色双虚线)产生的估计即期方差过程,其中使用了B*1in(40),σi=Vti,C(f)和λ的真值。我们取λ=200,θ=0.03,T=6个月,h=5分钟。三个即期方差估计值彼此非常接近,能够很好地拟合随时间变化的总体波动水平。

使用道具

36
nandehutu2022 在职认证  发表于 2022-6-11 04:06:32 |只看作者 |坛友微信交流群
平方误差之和,SSE=nXi=1(^σti- σti),#天#Obs/Hrρλθ=sd(f)f(0)E(^fn2(0))sd(^fn2(0))qMSE(^fn2(0))21 12 0 100 0.03 13.30 8.6965 5.4797 7.156721 12-0.5 100 0.03 13.30 8.8117 5.6950 7.251063 12 0 100 0.03 13.30 11.6005 2.1668 2.753763 12-0.5 100 0.03 13.30 11.4145 2.2175 2.9107126 12-0.5 100 0.03 13.30 11.9558 1.6286 2.111621 12 0 200 0.03 13.30 11.2759 2.6362 3.323621 12-0.5 200 0.03 13.30 11.1900 2.7161 3.439363 12 0 200 0.0313.30 11.9714 1.6997 2.158263 12-0.5 200 0.03 13.30 11.9234 1.6539 2.1518126 12-0.5 200 0.03 13.30 12.4776 1.3081 1.545121 12 0 1000 0.01 39.89 37.9363 4.5286 4.932121 12-0.5 1000 0.01 39.89 37.8582 4.2041 4.669363 12 0 1000 0.01 39 41.4335 2.9176 3.300763 12-0.5 1000 0.01 39.89 41.89 5071 3.0726 3.4722126 12-0.5 1000 0.01 39.89 41.8874 2.4255 3.1420表3:基于1000个样本的正常跳跃原点0。对于第1、4和oracle的估计值分别为1.6525、1.4457和1.4450。图2显示了对应于λ=1000和θ=0.01的相同结果。在本例中,第一、第四和oracle估算的SSE分别为2.0015、1.5069和1.4006。6结论与未来工作在本文中,我们研究了通过阈值法进行跳跃检测的问题,这显然与现货波动率估计问题密切相关。我们通过考虑二阶近似和非齐次参数设置,扩展了Figueroa-L'opez-andNisen(2013)的近似最优阈值。由于二阶近似的剩余部分要小得多,同时得到的阈值估值器是时不变的,这在现实中更有意义,因此,这一结果在理论上很有意义。

使用道具

37
能者818 在职认证  发表于 2022-6-11 04:06:34 |只看作者 |坛友微信交流群
蒙特卡罗研究也证明了二阶近似的优越性能。精度越高,估计的参数就越多。我们首先设法在原点构建跳跃密度的阈值核估计量。为此,我们提出了一个不同的“最佳”阈值,并说明了为什么这应该不同于原始的“最佳”阈值。直觉是,当我们声称一个增量包含一个跳跃时,我们必须更加准确,以便更好地估计其在原点的密度。我们还提出了现货波动率阈值核估计的修正版本,其中超过阈值的增量将被过滤掉。为了实施所提出的方法,我们需要解决一些关键障碍。具体而言,最优阈值、原点跳变密度和现货波动率的估计相互依赖。为了解决这个问题,我们提出了一种迭代阈值核估计方案。虽然我们不能保证迭代算法总是收敛,但蒙特卡罗研究表明,这在现实中很少产生任何问题。阈值法跳跃检测的精神在于,当过程增量的绝对值超过阈值时,就会发生跳跃,从定义上讲,这是一个二元结果。在这种情况下,当增量接近阈值时,增量的微小差异可能导致完全不同的结果。缓解这一问题的一种方法是估计跳跃在特定时间间隔内发生的概率,这类似于逻辑回归的思想。这为基于阈值的分类提供了一种替代方法。给定一个非递减函数F:[0,∞) → [0,1]和增量|iX |,我们可以假设在[ti]期间发生跳跃的概率-1,ti]是F(|九|)。

使用道具

38
何人来此 在职认证  发表于 2022-6-11 04:06:37 |只看作者 |坛友微信交流群
然后我们可以采用以下损失函数,即经常0.0 0.1 0.2 0.3 0.4 0.50.10 0.15 0.20 0.25时间t(年)即期方差图1:方差过程{Vt}t≥0(抖动的黑色虚线)和基于Bn2的算法3的第1次迭代(红色虚线)和第4次迭代(蓝色长虚线)产生的估计斑点方差过程(44)。我们还绘制了oracle方差过程(44)(绿色双虚线),将BI替换为真B*iin(40)。oracle和4Thitationation方差估计值重叠。我们取(47)中的参数值以及ρ=-0.5,λ=200,梅顿跳跃(48),θ=0.03。根据6个月内5分钟的观察结果进行估计。用于分类问题:Lt,h(F)=EF(| Xt+h- Xt |)1{Nt+h-Nt=0}+ E[1 - F(| Xt+h- Xt |)]1{Nt+h-Nt6=0}.实际上,对所有连续函数F进行优化可能会很麻烦。然而,我们可以尝试将自己限制在一个合适的、相对较小的可能函数F类中。一个可能的方向是考虑FB(x)=F(x/B),这是我们在本文中所做工作的推广。另一个可能的方向是考虑F(x)=F1n(x)1{0<x<B}+F2n(x)1{x≥B} ,其中f1和f2是两个可以依赖于n的函数。这可以潜在地提供关于F的形状在“最佳”阈值附近的外观的见解。主要结果的证明让我们从给出定理2.1证明所需的引理开始。引理A.1。对于i=1,2,让fi∈ C([0,∞)) 在(0,∞). 进一步假设fis不增加,而fis不减少,且limx→存在0+[f(x)+f(x)]。如果存在x∈ (0, ∞) 如(a)| f(x)|≥ |f(x)|对于所有x∈ (0,x)(b)| f(x)|≥ |f(x)|对于所有x∈ (十),∞), (50)那么,f:=f+fis在[0]上的拟凸,∞).证据自(a)至(50)和自f(x)≤ 0和f(x)≥ 0,f(x)=f(x)+f(x)≤ 0表示所有x∈ (0,x)。

使用道具

39
nandehutu2022 在职认证  发表于 2022-6-11 04:06:40 |只看作者 |坛友微信交流群
此外,这意味着limx→0+f(x)≤ 另一方面,从(b)in(50)f(x)=f(x)+f(x)≥ 0表示所有x∈ (十),∞).0.0 0.1 0.2 0.3 0.4 0.50.05 0.10 0.15 0.20时间t(年)即期方差图2:方差过程{Vt}t≥0(抖动的黑色虚线)和基于Bn2的算法3的第1次迭代(红色虚线)和第4次迭代(蓝色长虚线)产生的估计斑点方差过程(44)。我们还绘制了oracle方差过程(44)(绿色双虚线),将BI替换为真B*iin(40)。oracle和第四次迭代方差估计在整个域中几乎重叠,除了在最后。我们取(47)中的参数值以及ρ=-0.5,λ=1000,默顿跳跃(48),θ=0.01。根据6个月内5分钟的观察结果进行估计。根据实数变量连续实值函数拟凸性的已知充分条件(详见Boyd和Vandenberghe(2004)第99页(3.20)),可以得出f在[0,∞).定理2.1的证明。自始至终,我们假设w=1,γt,h>0(γt,h的情况≤ 0和w 6=0可以用类似的方法证明)。为了简单起见,我们省略了Lt,h(B;w)中的参数w。让F*kt,hde表示密度φt,h的分布* f*k、 跳跃次数Nt+h的条件- Nt,损失函数Lt,其拆分如下:Lt,h(B):=L(1)t,h(B)+L(2)t,h(B),其中L(1)t,h(B):=P(| Xt+h- Xt |>B,Nt+h- Nt=0)=e-hλt,h“1- ΦB-hγt,hσt,h√h!+Φ-B-hγt,hσt,h√h!#,L(2)t,h(B):=P(| Xt+h- Xt |≤ B、 Nt+h- Nt6=0)=e-hλt,h∞Xk=1hλt,hkk!F*kt,h(B)- F*kt,h(-(B).这里,Φ(·)是标准正态分布的cdf。注意,通过定义,L(1)t,his严格减小,而L(2)t,his严格增大。同样清楚的是,对于每个h>0和t∈ [0,T],L(1)T,h∈ C∞(R+)和BL(1)t,h(B)<0表示所有B∈ R+。

使用道具

40
大多数88 在职认证  发表于 2022-6-11 04:06:44 |只看作者 |坛友微信交流群
对于L(2)t,h,sincesupk的差异性∈Nsupx公司∈Rφt,h* f*k(x)≤ supx公司∈Rf(x)=:M(f)<∞, (51)下面是SUP∈NsupB公司∈(0,∞)φt,h* f*k(B)+φt,h* f*k级(-(B)≤ 2M(f),因此,根据有界收敛定理,L(2)t,his可微。同样,自supm∈Nsupk公司∈NsupB公司∈(0,∞)φ(m)t,h* f*k(B)+φ(m)t,h* f*k级(-(B)≤2M(f),我们可以进一步证明L(2)t,h∈ C∞(R+)的有界收敛定理。我们观察到L(1)t,h(B)6=0和L(2)t,h(B)6=0,所有B>0,因此我们现在继续研究比率,h(B):=BL(2)t,h(B)-BL(1)t,h(B)。让我们首先注意到BL(1)t,h(B)=-e-hλt,h√hσt,h“φB-hγt,hσt,h√h!+φB+hγt,hσt,h√h!#,(52)BL(2)t,h(B)=e-hλt,h∞Xk=1hλt,hkk!φt,h* f*k(B)+φt,h* f*k级(-(B). (53)一个直接后果是Rt,h(B)对于B是连续的∈ [0, ∞). Rt,hm现在可以写成:Rt,h(B)=∞Xk=1hλt,hkk!It,h,k(B),其中It,h,k(B):=σt,h√h类φt,h* f*k(B)+φt,h* f*k级(-(B)φB-hγt,hσt,h√h类+ φB+hγt,hσt,h√h类.通过卷积的定义,It,h,kc可以写成:It,h,k(B)=Zgt,h(w,B)f*k(w)dw,其中gt,h(w,B):=φB-hγt,h-wσt,h√h类+ φB+hγt,h+wσt,h√h类φB-hγt,hσt,h√h类+ φB+hγt,hσt,h√h类.插入正常p.d.f.,gt,Hc可以分解为:gt,h(w,B)=exp-w+2whγt,h2hσt,h!经验值B(hγt,h+w)/hσt,h+ 经验值-B(hγt,h+w)/hσt,h经验值Bγt,h/σt,h+ 经验值-Bγt,h/σt,h=: g(1)t,h(w)g(2)t,h(w,B)。不难证明g(1)t,h的下列性质:1≤ g(1)t,h(w)≤ ehγt,h/2σt,h,ω∈ (-2hγt,h,0)和0<g(1)t,h(w)≤ 1, ω ∈ (-2hγt,h,0)C.(54)g(2)t,h(ω,·)是t(x)=eax+e型函数-axebx+e-bx,其中x∈ [0, ∞), a=|(hγt,h+w)/hσt,h |和b=|γt,h/σt,h |。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-29 06:56