楼主: 大多数88
1520 24

[量化金融] 背景率随时间变化的Hawkes过程模型及其应用 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-5-31 04:25:37
让我们考虑[0,t]中的目标电流h(t),以及t=ηl时的相等空格≡ 对于给定的整数m′和整数l,将观测区间[0,T]划分为m′子区间{[ηl-1,ηl]}m′l=1等长w′=T/m′。在这种方法中,函数h(t)是使用一个在每个子区间是三次多项式且在节点处是光滑的函数来建模的。通过(m′+3)固定宽度基函数的线性组合{qj(t)=f((t- ηj-4) /w′)}m′+3j=1,其中▄f(·)是图2a中的三次B样条基。这里,基本函数qj(t)支持[ηj-4,ηj],是凹凸形状的光滑分段三次多项式。虽然固定宽度的Bspline基函数的线性组合在表示各种曲线时具有一定程度的灵活性,但这种方法不适合描述背景速率的时间变化,其中短期内的快速温度变化是预先发出的。一个基函数不能捕捉伴随着突发事件的快速时间变化,除非我们使用大量的基函数。另一方面,由于高频金融数据中的事件是以高度非均匀的方式分布的,对低活动区域的基函数的支持只包含少量的事件,导致对相应参数的估计较差。为了解决这个问题,我们使用可变宽度基本函数,其中宽度取决于事件的频率,如图2b的底部面板所示。附录B:构建可变宽度基函数描述了用可变宽度对形状基函数进行基因率突变的具体方法。我们的方法如图2b所示。我们首先引入自然时间坐标t′,其中事件的位置t′i等于指数t′i=i(i=1,2。

22
何人来此 在职认证  发表于 2022-5-31 04:25:40
,n),观察间隔的开始t′和结束t′n+1分别为0和n+1(图2b中的顶部面板)。然后,我们得到固定宽度基函数{Fj(t′)=~f((t′)- ξj-4) /w)}mj=1as在附录A中(图2b中的顶部面板),其中我们在t=ξl处放置结≡ (n+1)l/(m)- 3) 在w=(n+1)/(m)的间隔内- 3) 。接下来,我们从自然时间t′到实际时间t进行坐标变换,以获得宽度可变的基函数{fj(t)}mj=1(图2b)。虽然基函数{fj(t)}mj=1在适当的时间变换下是连续函数,但我们只是简单地将基函数{fj(t)}mj=1近似为在每个中心事件期间保持不变。因此,实际时间坐标中的基函数为fj(t)=fji≡ ti的Fj(t′i)≤ t<ti+1(i=0,1,…,n),其中t=S,tn+1=t。这种近似也使对数似然函数的计算变得容易。附录C:具有时间相关背景率的Hawkesprocess模型的贝叶斯估计我们的模型以参数{a,α,β}为特征,其中a=(a,…,am)T,对数似然函数为log L(a,α,β| D[S,T])=nXi=1logui+i-1Xk=1MXj=1αjβje-βj(ti-tk)-nXi=0ui(ti+1- ti)-nXi=1MXj=1αj[1- e-βj(T-ti)],(C1),其中ui=exp[Pmj=1aifji]。在我们的ca se中,a的参数数量相对较大,对于本研究中分析的一些数据,其数量大约为数百。在这种情况下,由于过度拟合,最大似然估计给出了u(t)的充分估计,并且往往计算不稳定。为了准确地估计这样大量的参数,我们采用了贝叶斯估计方法。

23
mingdashike22 在职认证  发表于 2022-5-31 04:25:42
在评估中,我们引入了参数a的先验概率分布,该分布限制了u(t)的灵活性,以防止过度拟合,给定asPV,W,uc(a)=Cexp-VnXi=1滴滴涕′mXj=1ajFj(t′i)-WPmj=1ajm- 对数uc!, (C2)式中,C是标准常数,V、W和ucare附加参数。指数中的第一项惩罚自然时间坐标t′中对数u(t′)=Pmj=1ajFj(t′)的一阶导数,参数V控制u(t)的平滑度(另见附录D)。指数中的第二项限制了平均参数值Pmj=1aj/m,这使得粗糙度下降到对数u(t)的基线,Pni=1logu(ti)/n。引入此ter m可使先前的归一化;因为第一项在转换aj下是不变的→ 对于常数c,aj+c(j=1,…,m),对应于垂直位移对数u(t)→ logu(t)+c来自关系pmj=1fji=1,之前的仅与Firsterm不能标准化。在本研究中,参数W被固定为一个非常大的值(例如10),因为模型参数{a,α,β}的估计值与W的值相差不大。在此设置中,我们有一个关系日志ucPni=1logu(ti)/n,因此参数ucre表示u(t)的基线。我们还注意到,我们的非平稳模型简化为平稳过程,u(t)=ucin的极限为V→ ∞和W→ ∞.在贝叶斯框架中,我们将参数θh={α,β,V,uc}a视为超参数s,并根据剩余参数a不同地估计超参数θhdi。我们首先考虑在超参数θh的给定值下估计参数a的方法。根据贝叶斯定理[43],参数a的后验概率分布给定超参数θhis给定pθh(a | D[S,T])∝ L(a,α,β| D[S,T])PV,uc(a)。

24
大多数88 在职认证  发表于 2022-5-31 04:25:47
(C3)最大后验概率(MAP)估计值*通过最大化后验值的对数获得。然后,我们考虑找到超参数θh的最佳估计。在给定asML(θh | D[S,t])=ZL(a,α,β| D[S,t])PV,uc(a)da的情况下,具有边际似然函数特征的超参数θhis的模型数据的拟合度,称为证据。(C4)我们使用拉普拉斯方法近似计算边际似然函数【44】;整数的对数围绕其峰值展开为a的二阶。在我们的例子中,峰值位于a=a*, 这是地图估计值。然后我们得到log M L(θh | D[S,T])mlog 2π-对数det(H)+对数L(a*, α、 β| D[S,T]+对数PV,uc(a*), (C5)式中,H表示a=a处被积函数对数的负数的Hessian矩阵*. 估计θ*hof超参数是通过最大化边际似然函数的对数来获得的【45】。参数集{a的最优估计*, θ*h} 最终被认为是超参数θ的最佳估计*交给地图估算a*在最优超参数θ下*h、 附录D:模型选择在本文中,我们将拟合优度与霍克斯过程模型和不同背景速率模型的数据进行比较。在比较具有不同复杂程度的模型时,对数似然并不能很好地衡量拟合优度,因为复杂模型的对数似然od高估了因过度拟合而产生的拟合优度。因此,根据模型的复杂性,增加对日志可能性的惩罚是一项标准任务【39,46】。对于用最大似然法(const、PL2h和pl30min模型)估计的模型,我们使用scorearg maxθlog L(θ| D)- (参数数量)基于Akaike信息标准[39],该标准将池塘与-AIC/2。

25
nandehutu2022 在职认证  发表于 2022-5-31 04:25:50
对于Bayesiamway中估计的mo de l,我们使用分数arg maxθhlog M l(θh | D)-(超参数的数量)基于凯克贝叶斯信息理论[40],其中ml(θh | D)是eq.(C5)中的边际似然。此分数对应于-ABIC/2。值得注意的是,解释u(t)时间变化的参数a对模型复杂性的影响自然包括在对数边际似然中。我们可以将等式(C5)重写为log M L=log L- (启用)。u(t)时间变化的复杂性由超参数V控制;对于较大的V值,估计的u(t)几乎是恒定的,对于较小的V值,估计的u(t)在时间上变化很大。对于V(低复杂度)的大值,惩罚项是almos t 0,对于V(高复杂度)的小值,惩罚项是m log(1/V)。附录E:性能对基函数数量的依赖性。表III总结了我们模型的良好性对基函数数量的依赖性。对于较小的k,通过增加基函数的数量,拟合通常得到了改善。我们还检查了k=25时的性能,但由于参数数量很大,一些数据的估计在计算上不稳定。表III.平均匹配分数(-ABIC/2)作为基函数数m=3+不适用 指数函数的个数。每个值都与最佳模型相关(k=50,M=2)。M=1 M=2 M=3 M=4k=50-19.7 0.0-0.3-1.9k=75-26.4-2.6-2.1-3.2k=100-31.7-5.1-4.2-5.6k=150-38.7-7.9-6.3-7.3k=200-43.9-10.2-7.9-9-9.0

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 05:36