楼主: 能者818
1926 58

[量化金融] 利用Hawkes过程检测强度爆发:应用于 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-26 19:42:19
在这种情况下,我们的模型读取λ(t)=u+Xti<tφ(t- ti)+φS(t- z) (7)现在z是模型的一个参数。一般来说,一旦霍克斯模型被指定,我们可以应用一系列方法,以便根据观测数据校准模型并估计其参数。这些方法包括最大似然估计(Rubin,1972;Ogata,1978;Ozaki,1979)和矩量法(Da Fonseca和Zaatour,2014)。还提供了一系列非参数工具(Bacry等人,2012年;Bacry和Muzy,2016年;Lewis和Mohler,2011年;Kirchner,2015年)。然而,这些主要局限于经典的霍克斯规范(1)。在参数估计中,最大似然估计被认为是霍克斯过程族的事实标准。给定强度(7)的函数形式和区间[0,T]内的观测值fti,可以最大化对数似然对数L(θ| Ft)=-ZTλ(s)ds+ZTlogλ(s)dNs(8),以获得参数θ的向量,其中包括IB的时间z和定义生育率f的核φs的参数。然而,我们事先不知道实现是否包含任何IBs。因此,我们需要确定已确定的布斯汀活性是否确实真实,或者是否可以单独归因于内源性机制。为此,我们将测试模型从简单的霍克斯过程(1)扩展到带有冲击的模型(7)是否改进了数据描述。一种自然的方法是比较模型(7)在最佳参数下评估的可能性与无IBs的霍克斯模型对应的最佳拟合。Ogata(1978)证明了在某些正则性假设下,简单、平稳、单变量点过程的最大似然估计是一致且渐近正态的,因为样本量趋于完整。

12
可人4 在职认证  发表于 2022-5-26 19:42:23
此外,他还建立了简单零假设的似然比检验具有标准χ分布。因此,正如Gresnigt和Franses(2015)所述,似然比(LR)测试和拉格朗日乘数(LM)测试等似然测试通常可用于区分不同的霍克斯规范。然而,我们的案例存在一些困难,使得此类测试不容易适用。我们的情况类似于在政权更迭问题中发现的情况,当变化点未知时。此外,在不存在IB的零假设下,一些参数没有确定。事实上,当α=0时,具有(6)中描述的IB项的模型简化为完整模型。因此,τ和z在空值下无法识别。人们还可以推测,归零不是唯一的,因为IB的影响对于z也是消除的≥ T或τ→ 0,或z<0且τ→ ∞. 如(Andrews,1993;Davies,1977,1987;Hansen,1996)所述,LR的标准渐近理论不适用于这些情况,必须采取其他方法。一系列文献通过所谓的“sup”类测试(参见Lange和Rahbek(2009)的调查)来处理这一问题,这些测试依赖于模拟零度下的LR分布来计算适当的p值。另一种方法(Wong和Li,2001)使用信息标准进行模型选择。使用最广泛的是Akaike信息标准C=2k- 2 log L(9),其中k表示估计参数的数量,Schwartz(或Bayesian)信息准则(BIC)BIC=k log N- 2 log L(10),如果样本量N>7(即log N>2),则惩罚更多额外参数。

13
何人来此 在职认证  发表于 2022-5-26 19:42:27
在本文中,我们遵循第二种方法,并将记录BIC在我们的测试中表现良好(参见第4节)。我们可以将识别单个IB的过程总结如下:1。使用最大似然估计估计估计零模型(无任何IB项的Hawkes模型(1));2、备选(扩展)模型(7)在z的约束下进行估计∈ [0,T];3、评分BIC=BIC- BICis评估。如果BIC<0,则弹出空模型,我们接受扩展模型。否则,我们将保留无外源爆发的空模型。在这里,我们用BICMT表示模型的分数,用M IBs表示。对于IB(6)的指数记忆核,完整模型和备选模型之间的参数数量差异为3,因此BIC=3对数N- 2(对数L- 日志L)。有关可能性优化的更多详细信息,请参阅附录A。3.2。多个IB的识别:预先识别我们现在讨论将我们的程序扩展到窗口[0,T]中有多个IB的情况,即模型(2),其中必须确定模型的zjare参数和IB总数M。由于问题的数值复杂性、经常存在的噪声数据和维数灾难,对全模型(2)的直接估计会导致具有多个局部极值的多变量成本函数的优化。为了有效地估计参数zjin(7),将每个zjt的搜索空间限制在某个区间[zj,zj]是有用的 [0,T]。这样做可以显著提高收敛性并减少局部极小值的数量。此外,它允许我们一次关注一个IB,从而依次增加模型的大小。因此,我们在本节中解决的问题是如何通过预识别有效且可靠地减少z的搜索空间。

14
大多数88 在职认证  发表于 2022-5-26 19:42:30
稍后,我们将介绍完整的程序。我们采用Almgren(2012)最初提出的方法,将高频数据中的价格跳跃检测到点处理设置。在他的工作之后,我们定义了指数平均函数uL(t;κ)和uR(t;κ)asuL(t;κ)=κZt-∞e-(t-s) κdNs=κXtj<te-(t-tj)κ(11)uR(t;κ)=κZ+∞te公司-(s)-t) κdNs=κXtj>te-(tj-t) κ,(12),其中κ是该方法的参数。函数uL(t;κ)和uR(t;κ)提供了过程速率的局部估计。第一种方法只考虑过去,而第二种方法只考虑未来。在t时,活性(IB)的强烈突然跳变将显著增加uR(t;κ),而不会对uL(t;κ)产生影响,因此我们认为这种差异(t;κ)=uR(t;κ)- uL(t;κ)(13),以确定跳跃的次数。图1提供了一个示例,其中函数(t,κ)表示κ的不同值。κ的选择将在第4.3节中讨论。的高值 对应过程强度的突然变化,从而提供一种确定可能IB位置的方法。作为IB times'ZJJ的候选者,我们选择(t;κ)在事件时间集{ti}上。此外,我们根据 最大值。我们从全局最大值z=arg maxt开始∈{ti}(t;κ),(14)定义了窗口W=[(R)z-w、 大小为w的“z+w”,在“z”周围,将使用最大似然估计量搜索z的最佳值。我们进一步排除所有接近“zthan w”的事件,并寻找下一个局部极值:“z=arg maxt”∈{ti:| ti-\'\'z |>w}(t;κ),(15)定义了另一个窗口W=[(R)z-w、 \'z+w]。

15
可人4 在职认证  发表于 2022-5-26 19:42:34
为了选择函数的不同最大值,排除很重要: 如图1所示,函数 israther持续存在,如果不采取此预防措施,则最有可能选择仅次于全局最大值的次优最大值。根据需要重复该过程多次,以找到候选时间'zk=arg maxt∈{ti:| ti-\'z |>宽,| ti-\'z |>w|ti公司-\'\'zk-1 |>w}(t;κ)(16)和相应的窗口Wk=[(R)zk-w、 实时分析中,不可能计算uR(t;κ)。然而,在这里,我们对历史数据的事后分析感兴趣,所以这种限制不会带来任何问题。为此,评估(t;κ)仅在事件时间。事实上,递归关系κuL(ti)=e-ti公司-ti公司-1κ(1+κuL(ti-1) )κuR(ti)=e-ti+1-tiκ(1+κuR(ti+1))保持。图1:具有两个IBs(顶面板)和相应函数的霍克斯过程模拟(t;κ)用于κ的不同选择(底部面板)。3.3。识别多个IB:估计windows WJ的排名已经确定,我们应用迭代程序来确定模型(2)的最佳参数以及IB的总数。首先,我们估计M=0的模型,这是一个标准的霍克斯模型。然后,我们用M=1和z估计模型∈ W、 此时,我们使用BIC(或其他模型选择标准)来决定是接受还是拒绝放大模型。如果不接受IB,则过程停止,并选择M=0的空模型。否则,将模型扩展到M=2的情况,并添加额外的IB项。在窗口W内估计zis的最佳值,同时保持z值固定,并重新优化所有其他参数。

16
能者818 在职认证  发表于 2022-5-26 19:42:38
信息标准再次用于比较M=2模型和M=1模型的惩罚可能性:然后新的扩展版本要么被接受,要么被拒绝。当Mk+1IB的添加不能显著提高模型Mk的可能性时,迭代过程停止。我们可以将完整的过程总结如下:1。给定一个实现{t,t,…,tN},我们选择κ和w.2的值。我们确定候选IB位置W、W……的排名。我们在数据(M=0)4上估计了一个标准的霍克斯模型。我们每次向模型中添加一个IBo如果BICM=k+1<BICM=k,则将候选IB zk+1添加到模型中,并检查下一个IB,nsize 0.3 0.5 0.7 0.91000 0.7 0.5 1.3 1.02000 0.4 0.4 0.7 0.65000 0.0 0 0.3 0.2 0.210000 0.1 0.0.3 0.2表1:当模拟模型没有IBs时,使用贝叶斯信息标准的误报百分比。所有数值均以百分比(%)表示否则,如果BICM=k+1>BICM=k,程序停止,我们认为M=k是IBs的最终数量。我们注意到,该程序依赖于预识别程序提供的排名。也可以考虑较少依赖预识别程序的停车标准。例如,在退出环路之前,可以考虑额外的IB,而不是在第一次故障时停止。关于优化程序的详细信息,我们再次参考附录A。数值模拟和模型验证为了验证我们的程序,我们进行了广泛的数值模拟。首先,我们检查了我们的程序产生的假阳性率。然后我们测试了它的统计能力。最后,我们研究了在窗口中存在两个IB的情况下,歧视是如何工作的。

17
可人4 在职认证  发表于 2022-5-26 19:42:41
由于即使在标准Hawkesprocess(1)的情况下,参数估计的偏差和方差也取决于参数本身的值,因此我们在不同样本大小上测试了参数的几种组合,以便对检测程序的效率有一个更广泛的认识。4.1。无外源冲击为了研究假阳性检测率,我们对具有内生核(5)且无IB的Hawkes过程(1)进行了蒙特卡罗模拟。参数为p=2.0,τ=0.1,n={0.3,0.5,0.7,0.9}。我们为每个参数集模拟了1000个实现。由于统计检验的威力很大程度上取决于样本量,因此在我们的模拟中,我们保持预期样本量E[N]=uT/(1-n) 通过拟合模拟视界T=3600并改变基线强度u来确定常数。我们使用大约1000、2000、5000和10000个事件的样本量进行测试。在每次模拟中,我们应用我们的程序并检查extendedmodel(7)是否优于标准Hawkes模型。总的来说,我们发现AIC的表现比BIC差得多,尤其是在n值较高的情况下。表1总结了BIC产生的误报率(以百分比表示)。从表中可以看出,即使是中等样本量(1000个事件)和基础过程(n~ 0.9)假阳性率约为1%,通常该方法的特异性接近100%。

18
kedemingshi 在职认证  发表于 2022-5-26 19:42:46
图2进一步说明了这一点,图2显示了观察得分的分布BIC。-5 0 5 10 15 20 25 30 35BIC0.000.020.040.060.080.100.120.14密度样品尺寸=1000n=0.9n=0.5n=0.3n=0.7-5 0 5 10 15 20 25 30 35BIC0.000.020.040.060.080.100.120.140.16密度样品尺寸=10000n=0.9n=0.5n=0.3n=0.7图2:差异分布在不存在IB项的空模型和在不存在IB项的模拟中估计出单个IB的完整模型之间的BIC。对于小于零的差异,将拒绝使用空模型。4.2。具有近似已知位置的单个IB我们现在考虑当存在一个IB时的数值模拟。这里我们给出了参数p=2.0,τ=0.1,n={0.3,0.5,0.7,0.9}的模拟结果。simulationwindow为[0,T],其中T=3600。在z=T/2时模拟IB,并考虑IB参数(f,τ)的35种不同组合(详情见下文)。如前所述,我们改变u的值,以保持预期的样本大小u+f(1- ez公司-Tτ)1- nT(17)近似恒定。我们进行了两组模拟,平均样本量分别为5000和10000。由于本实验的主要关注点是我们的程序和BIC选择标准的选择所导致的假阴性率,因此我们忽略了预识别程序,我们将在下一节讨论完整的程序。因此,我们将z的搜索空间限制在一个大小为100的窗口,该窗口围绕IB的真实位置:[T- 50,T+50]。我们在附录B中报告了测试结果。表B.14给出了5000个样本量的分支比n不同值的正确检测IBs的百分比。我们的结果表明,有一个区域对应于较低的肥力F值和较高的IB弛豫时间τ值(即。

19
大多数88 在职认证  发表于 2022-5-26 19:42:49
α=f/τ的小值),其中添加IB项对改善相似性没有显著贡献,因此拒绝使用扩展模型。霍克斯过程通过自激机制自然产生事件簇。集群的平均大小由1给出-n(参见Moller和Rasmussen(2005))及其方差isn(1-n) 。因此,如果外源性IB产生的事件级联与内源性IB产生的事件级联大小相似,那么我们的程序不会将其识别为IB。这实际上是一个需要的特征,因为我们想要识别与内源性动力学不兼容的IB。此外,这也表明,对于分枝比n的高值,更难区分内源性突发事件和外源性突发事件。4.3。预识别预识别算法的效率取决于“平滑参数”κ的选择。当κ很小时,局部强度的近似值会有噪声,并且会导致检测到许多局部极大值。另一方面,κ的大值导致对大多数强度波动进行平均,只留下较大的IB,但可能缺少中等规模的IB。为了测试选择κ的影响,我们用不同的参数组合(α,τ)模拟模型(7),然后用我们的预识别算法计算不同的κ值。结果报告在附录B中,图B.10显示了检测到的IB位置相对于事件之间平均距离的均方根误差δ=T/N,作为比率κ/τ的函数。正如所料,对于较小的α值,当检测外源IB困难时,z的估计误差可能非常大。

20
可人4 在职认证  发表于 2022-5-26 19:42:52
然而,我们观察到,对于相对较高的α值,误差下降到与事件间隔δ相当的值,当κ与τ的数量级相同时,性能最佳。当κ远大于τ时,α值较高时,性能也会恶化。这表明,如果已知IB的典型弛豫时间,那么最好的选择是选择相同顺序的κ。另一种但更复杂的方法是,本着的精神,对κ的多个值进行多尺度分析(Almgren,2012)。然而,考虑到(i)我们的方法是参数化的,预识别遵循最大似然估计;(ii)由于霍克斯过程(2)的随机性,局部强度的峰值不一定与开始时间z一致,并且可以根据核φ(t)延迟,我们认为多尺度方法过于复杂。4.4。单IB检测和完整程序我们现在在存在一个IB的情况下测试我们的完整程序。我们遵循第4.2节中的相同程序。然而,现在我们没有对Z施加搜索间隔,而是应用预识别方法。我们将κ设置为100,并将(14)–(16)中的搜索窗口大小设置为w=300,即在进行最大似然估计时,我们对zjin窗口Wj=[(R)z执行约束搜索- 150,’z+150]。我们认为,当检测到的IB之一在其发生时间60个时间单位的公差范围内时,我们的程序可以正确识别实际IB。这也包括实际IB不是第一个被检测到的情况。表2报告了n、f=ατ和τ的不同组合的正确分类IBs(真阳性)的百分比。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 22:28